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Liebe Informatikerin, lieber Informatiker der nächsten 
Generation, damit Sie sich bei der Arbeit mit dem Buch gut 


7 zurechtfinden, wird hier der Aufbau kurz beschrieben. 


1.1 Beziehungsgeflechte übersichtlich darstellen: Graphen 
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| Inhaltliche Kapitel mit 
handlungsorientierten Ein- 
stiegsaufgaben, Erklärun- 
gen und Beispielen, damit 
Sie informatische Konzepte 
verstehen und kreativ ein- 
setzen können 


„Teste dich selbst!“-Aufgaben 
zum Überprüfen, ob Sie die 
wesentlichen Aspekte eines 
Hauptkapitels verstanden 


haben (Lösungen zur 
Selbstkontrolle am Ende des 


Buches!) 


Kurze und prägnante 
Zusammenfassungen 

am Ende jedes Haupt- 
kapitels und Merkkästen 
mit den zentralen Inhalten 
am Ende jedes Kapitels 


Vielfältige Aufgaben zum 
Üben und Vertiefen sowie 
spannende Forschungsaufträge 
als Blick über den Tellerrand 
und Lehrplan hinaus 


Dateivorlagen auch im 
Internet unter 
informatikschulbuch.de 


Kommniatin in imermet 


Texte Zum Weiterlesen, 
die Ihnen Einblicke in Be- 
rufe und Ausblicke auf 
inhaltlich angrenzende 
Anwendungsbereiche 


geben 


Die Symbole beschreiben für jede Aufgabe 
Arbeitsweisen bzw. Zielsetzung. 


Recherchieren, lesen, damit Sie selbst Verantwortung für den Lernfortschritt N 
übernehmen können. 


Vernetzen, damit Sie neue Inhalte mit anderen Bereichen und bereits Gelerntem \ 
in Beziehung setzen können. 


Kommunizieren, weil es wichtig ist, anderen etwas erklären zu können und sich in 
der Gruppe zu besprechen. 


Kooperieren, damit Ihre Produkte vielseitiger, hochwertiger und umfangreicher 
werden. 


Kreativ arbeiten, damit Sie originell und mit persönlicher Note arbeiten können. 


Analysieren, um Strukturen, Verfahren und Zusammenhänge zu erkennen und zu 
erfassen. 


Modellieren, um Probleme zu verstehen und Lösungen zu planen. 


Mit Rechnereinsatz lösen/implementieren, um mithilfe des Computers 
praktische Umsetzungen zu schaffen. 


Handlungsorientiert lösen, damit Sie auch ohne Rechner aktiv werden können, 
z.B. bei Rollenspielen. 


Reflektieren, begründen, damit Sie sich Lösungswege bewusst machen und 
ähnliche Aufgaben künftig schneller lösen können. 


Offene Aufgabenstellung individuell ausgestalten, damit Sie sich selbst Ziele 
setzen und Ihren eigenen Lösungsweg suchen können. 


"HOT PBEURG 


Diese Inhalte und Aufgaben gehen über den Lehrplan hinaus. 


Auf informatikschulbuch.de 


finden Sie einführende Videos Werkzeugunabhängigkeit in Lehrtext und Aufgaben: 
für die typischen Werkzeuge. 


Basisprojekte für viele gängige Sprachen und typische 


6) Entwicklungsumgebungen ) 
S 
NY 


Java (BlueJ), Stride (BlueJ), Python, 
Swift (Playgrounds) 


OÖ 


Java 
void ZuobjektGehen() 


while (1 Berührt ()] 


Gehen (10); 


ji zuobjertsenen‘! Python 
anre det = 
{ P gerührt ninopjektGehen self) 
while ile !self.Berührt () 
\ Genen (10) Self.Gehen (10) 


} 


} 


Wir wünschen Ihnen viel Spaß im Informatikunterricht mit diesem Buch! 
Peter Brichzin Florian Janus Franz Jetzinger Johannes Neumeyer 
Dr. Stefan Seegerer Klaus Reinold Albert Wiedemann 
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In diesem Kapitel werden Sie ... 


„.. komplexe Beziehungsgeflechte 
mit Graphen übersichtlich 
darstellen. 


... Zusammenhänge in solchen 
Beziehungsgeflechten aus der 
Darstellung ableiten. 


... Algorithmen entwickeln, die 
schnellste Wege von A nach B 
finden. 


solange aktuellerOrt != zielOrt 


Yo 


Die Lage der 
Knoten und 

die Länge der 
Kanten müssen 
bei so einem 
Modell nicht 
mit der Realität 
übereinstimmen, 
oft wird aber 
versucht, Knoten 
entsprechend der 
geografischen 
Lage anzuordnen. 


@® 


NT 


1 Vernetzte Strukturen - Graphen 


1.1 Beziehungsgeflechte übersichtlich darstellen: Graphen 


In sozialen Netzwerken stehen User in Beziehungen, z. B. „Sam ist befreundet mit Lina” 
oder „Lina hat das Bild von Sam kommentiert.” Damit ein Computer sie verarbeiten kann, 
müssen solche Zusammenhänge abstrahiert und reduziert modelliert werden. 


ran) Ver) =D 
CLam2 1Ccrinne> Chan Cu Gas — Ca 
Sabina ® There 


a In den Abbildungen werden Freundschaften, Freundschaftsanfragen und vergebene 
Likes für geteilte Inhalte eines anderen Mitglieds dargestellt. 
Ordnen Sie jede Abbildung einem Kontext zu und begründen Sie Ihre Zuordnung. 

b Skizzieren Sie auf Basis der Abbildungen aus a) drei weitere Abbildungen, die folgende 


Beziehungen darstellen: 
i „folgt“ ii „stammt aus derselben Stadt” 


iii „hat8gemeinsameFreundemit” 


c Für Schnelle: Gruppen, in denen jeder mit jedem befreundet ist, können spezielle priva- 
te Chatrooms nutzen. Geben Sie an, wie viele einzelne Verbindungen zwischen Mitglie- 
dern bestehen müssen, bevor einer Gruppe aus drei (vier, fünf) Mitgliedern ein solcher 
Chat ermöglicht wird. Ermitteln Sie auch eine allgemeine Formel für die Verbindungs- 


anzahl bei n Mitgliedern. 


Eine vereinfachte Karte 

Fiona und Tom wollen nach dem Abitur in Südfrankreich 
eine Hausbootreise unternehmen. Von ihrem Bootsver- 
leih erhalten sie eine Karte mit den für sie wichtigen An- 
gaben. Im Wesentlichen bestehen solche Karten aus 
zwei Elementen: wichtigen Punkten (Ortschaften, Anle- 
gestellen, ...) mit Eigenschaften wie Name, Größe, Ein- 
kaufsmöglichkeiten etc. sowie Linien zwischen den 
Punkten, die Verbindungen, Beziehungen oder Ähnli- 
ches ausdrücken und Information über Weglänge, Zeit- 
bedarf, maximale Bootsgröße etc. bereitstellen. 

Für einen schnellen Überblick möchte sich Tom auf die 
wesentlichen Punkte der Karte konzentrieren und fertigt 
eineZeichnungan,dieeran dasSteuerrad klemmen kann. 
Er kopiert nur den für seine Strecke notwendigen Teil und 
auch dort nur die notwendigen Informationen. Die Fluss- 
verläufe abstrahiert er zu einfachen Linien und die Anle- 
gestellen zu einfachen Kreisen, die mit dem jeweiligen 
Namenbeschriftetsind.Die Information beiden Fahrtstre- 
cken reduziert er auf Kilometerangaben. Zusammenge- 


Castets-en-Dorthe 


Castelmoron- 


er 
E, sur-Lot Villeneuve-sur-Lot 


Buzet- 
sur-Baise 


Valence- 
sur-Baise 


St.-Jory 


fasst kommen in seiner Karte nur noch Objekte zweier Klassen vor: Die Anlegestellen und die Wege. 
Allgemein nennt man eine solche Informationsstruktur Graph. Sie besteht aus einer Menge von 
Knoten (hier den Anlegestellen) und einer Menge von Kanten (hier den Fahrtstrecken). Graphen 
werden häufig durch Diagramme visualisiert, bei denen die Knoten als Kreise, die Kanten als Li- 
nien dargestellt werden. 


Eigenschaften von Graphen 

Tom hat bei seiner Version der Karte die Weglängen bei den Kanten eingetragen. Einen solchen 
Graphen nennt man gewichtet, die Weglängen nennt man die (Kanten-)gewichte. Hätte er die 
Wege als Linien eingetragen, ohne die Weglängen zu notieren, würde man den Graphen unge- 


wichtet nennen. 


ungewichteter Graph Zyklus 


gewichteter Graph 


Als Fiona die Übersichtskarte des Hausbootanbieters genauer betrachtet, fallen ihr noch ein paar 
Besonderheiten auf: In manchen Verleihzonen sind Rundfahrten möglich, d. h. von manchen 
Anlegestellen aus gibt esWege, die wieder zu dieser Anlegestelle zurückführen. In Graphen nennt 
man solche Rundwege Zyklen. In anderen Verleihzonen sind nur Hin- und Herfahrten möglich, 
die zugehörigen Graphen sind zyklenfrei. Die meisten Verleih- 

zonen sind durch Wasserstraßen verbunden, sie sind zusammen- as 
hängend. Man sagt auch: Zu je zwei Knoten gibt es (mindestens) 
einen Pfad (Weg, Kantenzug), der sie verbindet. Andere Teile sind nicht zusammenhängender, 
völlig isoliert. Der Gesamtgraph ist daher nicht zusammenhän- zyklenfreier Graph 
gend. 


Gerichtete Graphen 

Als Fiona die Karte nochmal genau anschaut, fällt ihr ein interes- 
santes Detail auf. An einem großen Abschnitt wurde zur Umfah- 
rung ein Kanal gebaut. Auf dem Fluss darf man hier nur flussab- 
wärts fahren, auf dem Kanal in die Gegenrichtung. Die Kanten für 
den Fluss gehen nur in eine Richtung, die für den Kanal in die an- 
dere Richtung. Der Graph ist gerichtet. 

Auch gerichtete Graphen können gewichtet sein, sie können 
Zyklen enthalten und sie können stark oder schwach odernicht 
zusammenhängend sein. 

Bei Straßenkarten können die meisten Straßen in beide Rich- 
tungen befahren werden, es gibt nur wenige Einbahnstraßen. 
Streng genommen müsste hier ein vollständig gerichteter 
Graph gezeichnet werden. Zur Vereinfachung werden aber die 

in beiden Richtungen befahrbaren Straßen als eine ungerichte- 

te Kante gezeichnet. 


gerichteter Graph 


gerichteter Graph - Vereinfachung 


Ein Graph besteht aus einer endlichen Menge von Knoten und einer endlichen Menge von 
Kanten; eine Kante ist eine Verbindung zwischen zwei Knoten. Bei gerichteten Graphen 
hat jede Kante eine Richtungsangabe. Eine Folge von Kanten, die zwei Knoten verbindet, 
heißt Pfad, wenn jeder Knoten nur ein Mal besucht wird. Bei gewichteten Graphen wird 
jeder Kante ein Wert zugeordnet, das Gewicht. Beizusammenhängenden Graphen gibt es 
von jedem Knoten einen Pfad zu jedem anderen Knoten; bei gerichteten Graphen spricht 
man von stark zusammenhängend, von schwach zusammenhängend, wenn nur der zu- 
grunde liegende ungerichtete Graph zusammenhängend ist. Gibt es mindestens einen 
Knoten, von dem aus ein Pfad wieder zu ihm zurückführt, heißt der Graph zyklisch. 
Graphen können als Diagramme mit Knoten als Kreisen und Kanten als Verbindungslinien 
dargestellt werden. 


1.1 Beziehungsgeflechte übersichtlich darstellen: Graphen Sa 


Ein gerichteter 
Graph ist stark 
zusammenhängend, 
wenn es von jedem 
Knoten zu jedem 
anderen einen 
gerichteten Pfad 
gibt, schwach 
zusammenhängend, 
falls der zugehörige 
ungerichtete Graph 
zusammenhängend 
ist. Jeder Graph, 
der stark zusam- 
menhängend ist, 

ist auch schwach 
zusammenhängend. 


v 


Die abstrakte 
Datenstruktur 
Graph und 
deren graphische 


Darstellung 
(Visualisierung) 
sind zwei 
verschiedene 
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Aufgaben 


oO A 1 Informatik ist überall: ICE-Verbindungen 
Erkundigen Sie sich im Internet nach den ICE-Verbindungen innerhalb Deutschlands. 

& a Erstellen Sie einen gewichteten, ungerichteten Graphen für die ICE-Verbindungen 
zwischen 10 Städten Ihrer Wahl. Als Knotenbezeichner verwenden Sie die Kfz-Kennzeichen 
der Städte. Die Gewichtungen der Kanten sollen die Fahrzeiten in Minuten sein. Benutzen 
Sie zur Darstellung des Graphen das bereitgestellte Programm. Hinweis: Sollten Sie Verbin- 
dungen mit unterschiedlichen Zeiten finden, nehmen Sie immer die kürzeste Zeit. 

b Nennen Sie weitere Gewichtungen des ICE-Graphen, die ebenfalls sinnvoll wären. 
c Für Schnelle: Erläutern Sie, welches Problem mit den vereinfachten Knotenbezeichnern 
auftritt, wenn man Städte wie München oder Berlin genauer darstellen will. 


BB oO a. 2 Fluglinie 
jarra Informieren Sie sich im Internet über die Flugrouten einer (nicht 
zu kleinen) Fluggesellschaft. 
©] a Erstellen Sie einen ungewichteten, ungerichteten Graphen für 
die Flugrouten. Als Knotenbezeichner verwenden Sie die in- 


ternational gebräuchlichen Abkürzungen für die Flughäfen. 


Verwenden Sie bei Der Graph sollte etwa 20 Knoten enthalten. Benutzen Sie zur 

den Aufgaben 1 und e 

2 zur Erstellung Darstellung des Graphen das bereitgestellte Programm. 

das bereitgestellte Tipp: Starten Sie dazu in einer Stadt Ihrer Wahl und recherchie- 

I & ren Sie dann Schritt für Schritt Verbindungen in andere Städte. 

ee b Ergänzen Sie den Graphen aus Teilaufgabe a) zu einem gewichteten Graphen, indem Sie 
Verwendung ab. die Flugdauer in Minuten eintragen. Achten Sie bei den Zeitangaben in den Flugplänen 


der Fluggesellschaft darauf, dass es sich dabei oft um Angaben in Ortszeiten des jeweili- 
gen Flughafens handelt. 
c Für Schnelle: Begründen Sie, warum die Verwendung eines ungerichteten, gewichteten 
Graphen für die Flugrouten ungeeignet ist. Geben Sie die Ursache für die unterschiedli- 
| chen Flugzeiten an. Arbeiten Sie in den Graphen aus Aufgabe b) die Unterschiede für Kan- 
[@] ten ein, bei denen Hin- und Rückflugzeiten sich um mehr als fünf Minuten unterscheiden. 


Amsterdam 


PX 


@ a 3 Europareise mit dem FlinkBus 

Im Graphen rechts sind einige europäische Bus- 
verbindungen des Unternehmens FlinkBus dar- 
gestellt. Nehmen Sie zur folgenden Aussage be- 
gründet Stellung. 
„Der Graph ist völlig falsch, weil weder die geo- 
graphischeLagenochdieEntfernungen zwischen 
den Städten korrekt sind“ 


& 4 Richtig oder falsch 
a Ein Graph wird durch seine Knoten 
beschrieben. 
b Ein gerichteter Graph ist immer zusammenhängend. 
c Ein zusammenhängender Graph mit 4 Knoten benötigt mindestens 4 Kanten. 
d Ein Graph mit 4 Knoten und 5 Kanten hat mindestens einen Zyklus. 
e Ein gewichteter Graph ist immer gerichtet. 
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1.1 Beziehungsgeflechte übersichtlich darstellen: Graphen 


5 Londoner U-Bahn 

Rechts sehen Sie einen Ausschnitt des Lon- 

doner U-Bahn-Netzes. 

a Erstellen Sie einen ungerichteten Gra- 
phen für die Verbindungen. Als Knoten- 
bezeichner verwenden Sie die Namen 
der Haltestellen. Beschränken Sie sich auf 
die durch Kreise dargestellten Bahnhöfe. 

b Geben Sie an, welche Vereinfachungen 
Sie vorgenommen haben, und begrün- 
den Sie diese Änderungen. 

c Im Plan ist der Lauf der Themse eingezeichnet, obwohl der Fluss nichts mit dem U-Bahn- 
Netz zu tun hat. Begründen Sie, warum die Themse trotzdem in den Plan aufgenommen 
wurde. 


6 Graphen - gleich und doch nicht gleich & 
Welche der vier Diagramme stellen denselben Graphen dar? Begründen Sie Ihre Aussage. 


LS ZT 
9 0) 
app 


Königsberger Brückenproblem 
Dem Mathematiker Leonhard Eulerwurde 
1736 folgendes Problem gestellt: „Durch 
Königsberg fließt der Pregel, der sich teilt 
und zwei Inseln umfließt. Gibt es einen 
Rundweg, bei dem man alle sieben Brü- 
cken über den Pregel genau einmal über- 
quert und wieder zum Ausgangspunkt 
gelangt?“ 
a Stellen Sie das Königsberger Brücken- 
problem als Graph dar. Die Stadtteile 
A bis D bilden die Knoten, die Brücken 
sind die Kanten. Versuchen Sie einen 
Rundweg entsprechend der Vorgaben 


\ 
@ 


S 


zu finden. Geben Sie an, woran dies scheitert. ®) © 
b Finden Sie einen Rundweg zum Graphen mit den Knoten NZ 
A-F in der Abbildung rechts. &|x|»® 
c Geben Sie den wesentlichen Unterschied der Graphen von er 
Aufgabe 7a) und 7b) an, der beim zweiten Graphen einen (A) (E) 


Rundweg ermöglicht. 
Tipp: Bei den Graphen im Bild rechts ist einmal ein Rundweg SS > 


möglich, einmal nicht. 
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ZB ° 


Be * 


Aus 10 


Tipp: Es sind 
insgesamt 
14 Knoten 
notwendig. 
Zeichnen Sie 


die Platzhalter 
dafür zunächst 


in einem großen 
14-Eck, 


h 
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Turniere 

a Fünf Freundinnen wollen ein Tennisturnier durchführen, bei dem jede gegen jede ein- 
mal spielt. Stellen Sie diese Situation als Graph dar, mit den Teilnehmerinnen als Knoten 
und den Spielen als Kanten zwischen den beteiligten Spielerinnen. 
Geben Sie an, wie viele Kanten (Spiele) es gibt. 

b Einen Graphen, bei dem von jedem Knoten zu jedem anderen Knoten eine direkte Ver- 
bindung vorliegt, nennt man einen vollständigen Graphen. 
Überlegen Sie allgemein, wie viele Kanten ein vollständiger Graph mit n Knoten hat, und 
geben Sie die Anzahl als von n abhängigen Term an. Beachten Sie, dass eine Verbindung 
von Anach B und von B nach A nur einmal als Kante zählt. 
Tipp: Wie viele Kanten gehen vom ersten Knoten aus, wie viele zusätzliche vom zweiten 
usw.? 

c Berechnen Sie unter Verwendung der Formel aus Teilaufgabe b) die Anzahl der Spiele in 
der Hinrunde der Fußball-Bundesliga der Männer (18 Vereine). 


Die echten Teiler 
einer Zahl sind alle 
Teiler dieser Zahl 
außer der Zahl selbst. 


Teiler 
Ein Graph hat die Zahlenwerte 1 bis 9 als Knoten, die über 
die Beziehung „ist echter Teiler von“ gerichtet verbunden 


& 
ei 4 


a Zeichnen Sie den Graphen und nennen Sie die Anzahl der Kanten. | | 
b Geben Sie an, welcher Knoten entfernt werden muss, damit der Graph nicht 

mehr zusammenhängend ist. 
c Geben Sie an, wie sich der Graph ändert, wenn die Beziehung,,ist Teiler von“ lautet. 


Umfüllprobleme Teil 1 

Wenn man eine bestimmte Menge Flüssigkeit benötigt und mehrere Gefäße bekannter Grö- 

ße, aber nicht der passenden Größe hat, kann man versuchen, durch Umfüllen (nicht Weg- 

schütten) der Flüssigkeit doch noch die benötigte Menge abzumessen. Damit man Lösungen 
solcher Probleme anschaulich und gut nachvollziehbar ermitteln kann, ist die Modellierung 
mit einem Graphen oft hilfreich. 

a Beim bekanntesten Problem dieser Art ist ein volles Gefäß mit 8 | Inhalt vorhanden, zu- 
sätzlich zwei weitere, leere Gefäße mit je 4 | bzw. 3 | Inhalt. Es sollen 2 | abgemessen wer- 
den. Übernehmen Sie den gegebenen Teil des Graphen in Ihr Heft und ergänzen Sie zu 
einem (gerichteten) Graphen, der von jedem Knoten aus 
eine Kante für jede mögliche Umfüllung hat. Bei jedem 
Knoten wird die Füllmenge der drei Gefäße angegeben. 
Markieren Sie am Ende den Knoten, bei dem ein Gefäß die 
gesuchte Menge von 2 | Flüssigkeit enthält, und markie- 
ren Sie auch den Weg (d. h. die Umfüllvorschriften) vom 
Ausgangsknoten zu diesem Knoten. 

b Bei einem ähnlichen Problem sind ein volles Gefäß mit 8 | Inhalt, ein mit 2 | gefülltes Ge- 
fäß der Größe 7 | sowie ein leeres Gefäß der Größe 6 | gegeben. Zeichnen Sie auch hier 
den Graphen aller Umfüllmöglichkeiten und lesen Sie daran ab, welche Flüssigkeitsmen- 
gen sie abmessen können. 

c In einer leicht abgewandelten Fragestellung läuft aus einer Quelle beliebig viel Wasser. 
Sie haben ein (leeres) Gefäß mit 4 | und ein Gefäß mit 3 | Fassungsvermögen. Bestimmen 
Sie auch hier durch Zeichnen des Graphen, wie Sie 2 1 Wasser abmessen können. 

Tipp: Sie können die Gefäße nicht nur beliebig oft füllen, Sie können die Gefäße auch in 
den Abfluss der Quelle ausleeren. 


11 Komplizierte Überfahrt 


a Ein Mann will mit einem kleinen Boot einen Fluss überqueren. Er hat einen Wolf, eine 
Ziege und einen Kohlkopf dabei. In dem Boot kann er immer nur einen „Passagier“ mit- 
nehmen. Wenn der Mann aber den Wolf mit der Ziege allein zurücklässt, frisst der Wolf 
die Ziege. Bleiben Ziege und Kohlkopf allein, frisst die Ziege den Kohlkopf. 

Zeichnen Sie einen Graphen, bei dem in den Knoten die auf jedem Ufer vorhandenen 
„Passagiere“ dargestellt werden (z.B. (-|WZK) für den Startknoten) und an dessen Kanten 
markiert ist, welcher „Passagier“ gerade im Boot mitgenommen wird. Einer Kante, die zu 
einem Verlust führt, brauchen Sie nicht weiter nachzugehen. Lesen Sie aus diesem Gra- 
phen ab, wie der Mann ohne Verluste an sein Ziel kommt. 

b Ein ähnliches Problem haben drei Gesangscoaches mit ihren Schützlingen: Für die Fahrt 
in ein Studio haben sie nur einen kleinen Wagen, der nur zwei Personen fasst. Außerdem 
hüten die Coaches ihre Schützlinge so eifersüchtig, dass sie es nicht erlauben, dass einer 
zusammen mit einem anderen Coach im Hotel/im Studio oder im Auto ist, wenn sie 
nicht selbst dabei sind. Bestimmen Sie mit Hilfe des zugehörigen Graphen eine Lösung 
für die Transferfahrt. 

c Vier Studenten kommen nachts von einem Fest heim. Sie müssen in der Dunkelheit ei- 
nen engen Steg überqueren. Zum Glück hat wenigstens eines ihrer Handys genügend 
Akku-Ladung, so dass sie mit der Lampen-App noch eine Weile leuchten können. Aber 
der Schein des Handys reicht nur so weit, dass immer nur zwei Leute gemeinsam gehen 
können. Und da der Akku des Handys schon ziemlich leer ist, müssen sie eine schnelle 
Lösung suchen. Sven braucht für die Überquerung 5 Minuten, Olaf benötigt 10. Jan ist 
etwas unsicher und benötigt 20 Minuten, Hein sogar 25. 

Erstellen Sie einen Graphen für die Überquerungsmöglichkeiten und lesen Sie daraus 
ab, wie lange die Überquerung mindestens dauert. 


12 Forschungsauftrag: Wer kennt wen 


Das Kleine-Welt-Phänomen beschreibt eine Hypothese, nach der jeder Mensch auf der Welt 
mit jedem anderen über eine sehr kurze Kette von maximal 5 oder 6 Bekanntschaftsbezie- 
hungen verbunden ist. 

a Stellen Sie Bekanntschaftsbeziehungen als Graph dar. Beschränken Sie sich auf 15 Perso- 
nen, die aber nicht alle Ihre Bekannten sind. Fragen Sie Ihre Bekannten, wen diese ken- 
nen, den Sie nicht kennen. 

b Ein Internetphänomen ist das Kevin-Bacon-Orakel: In dieser Spezialisierung wird das 
Problem auf die Frage reduziert, welche Schauspielerin oder welcher Schauspieler über 
wie viele Bekanntschaftsbeziehungen mit dem Schauspieler Kevin Bacon bekannt ist. 
Als Bekanntschaftsbeziehungen wird hier festgelegt: Eine Schauspielerin oder ein 
Schauspieler ist mit einer oder einem anderen bekannt, wenn sie oder er in einem glei- 
chen Film mitgewirkt hat. Die Anzahl der nötigen Bekanntschaftsbeziehungen wird 
auch als Bacon-Zahl (Bacon number) bezeichnet. 
Ermitteln Sie für fünf verschiedene Schauspielerinnen bzw. Schauspieler die Bacon-Zahl 
und zeichnen Sie den Teil des Bekanntheitsgraphen. 
Tipp: Mit der Sucheingabe „calculate bacon number“ finden Sie geeignete Seiten. 

c Begründen Sie, warum die Bacon-Zahl typischerweise deutlich kleiner ist als 5 bis 6. 
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1.2 Beziehungen tabellarisch darstellen: Die Adjazenzmatrix 


Im „Zeittauschverein“ der Gemeinde Infohausen unterstützen sich die Mitglieder gegen- 
seitig mit dem, was sie gut können, und stärken dadurch das soziale Miteinander: Roy 
babysittet für Moss, der mäht den Rasen von Delina, die wiederum Roys Computerproble- 
me löst usw. Ziel ist es, dass sich die 
Summe der investierten Zeiten für alle 
ausgleicht. 

a Lesen Sie aus der Tabelle ab, wie viel 
Zeit Moss bisher für Delina aufge- 
wendet hat und wie viele Stunden 
Moss insgesamt noch ‚im Minus‘ ist. 
Erklären Sie, was festgelegt sein 
muss, damit die „Zeittabelle” auch für 
Außenstehende eindeutig ist. 

b Alle fünf sind im sozialen Netzwerk Vitamin angemeldet. Dort ist Roy mit allen außer 
Moss „befreundet“ und Jen neben Roy noch mit Delina. Erstellen Sie eine Tabelle wie in 
a), die dies beschreibt. Geben Sie an, inwiefern sich die Tabellen aus a) und b) in ihrer 
Struktur unterscheiden. 

c Die Tabellen aus a) und b) sind eine Möglichkeit zur Darstellung von Graphen. Übertra- 
gen Sie beide jeweils in die bekannte Diagrammdarstellung. Diskutieren Sie dann zu 
zweit, aus welcher Darstellungsform die verschiedenen Grapheneigenschaften jeweils 
einfacher abgelesen werden können. 


Eine Tabelle für die Weginformation O) Nürnberg 
Laura und Dario möchten nach dem Abitur vierWochen lang mit ihrem 
Interrailticket durch Europa fahren. Einige Streckenabschnitte haben 
sie bereits geplant, aber der Beginn von Deutschland über Österreich 
nach Italien ist noch offen. Bei ihrer Suche nach möglichen Routen ha- 
ben sie sowohl Diagrammdarstellungen als auch Tabellen gefunden. 
Nach kurzem Vergleich wird ihnen klar, dass die Diagrammdarstellung 
einen besseren Überblick über die gesamte Situation ermöglicht, denn 
häufig werden die Knoten abstrahierter Landkarten entsprechend der 
geografischen Lage angeordnet. Die Tabelle dagegen reduziert die 
Information auf die Entfernungsangaben. 


Die tabellarische Form isteine geeig- 
nete Modellierung eines Graphen, 
wenn die Entfernungsangaben in 
einem Programm ausgewertet wer- 
den sollen, z. B., um kürzeste Wege 
zu ermitteln. 


1.2 Beziehungen tabellarisch darstellen: Die Adjazenzmatrix 


Adjazenzmatrix - 2-dimensionale Felder 

Für die Umsetzung einer Entfernungstabelle in einem Programm, mit dem sich dann auch 
Fahrtrouten errechnen lassen, kann ein Feld von Feldern (ein sogenanntens zweidimensionales 
Feld) verwendet werden. Allerdings können die Knotennamen nicht als Feldindizes benutzt 
werden; hierfür werden Zahlen benötigt. Um diese Zahlen festzulegen, wird zuerst ein Feld mit 
den Knoteninformationen erstellt. Dort hat jeder Knoten einen eindeutigen Index. Dieser Index 
wird auch verwendet, um die Information in dem zweidimensionalen Feld anzusprechen. Der 
erste Index ist der Index des Startknotens, der zweite Index ist der Index des Zielknotens. 


Adjazenzmatrix als 
Knotenfeld Feld von Feldern 


bo: KNOTEN 


sa: KNOTEN 


name = "Salzburg 


vr: KNOTEN 


Weglänge von Salzburg nach München: 
matrix.ElementGeben(4).ElementGeben(2) hat den Wert 145 


In dieses zweidimensionale Feld tragen Laura und Dario nun die Werte für die direkten Verbin- 
dungen ein, d. h. die Gewichte der Kanten, so wie sie im Graph zu sehen sind. Die restlichen 
Feldelemente besetzen sie mit dem Wert -1, um anzuzeigen, dass hier keine direkte Verbindung 
besteht, es hier also keine entsprechende Kante gibt. Die diesem Feld entsprechende Tabelle 
nennt man >Adjazenzmatrix des Graphen. 


Sowohl ein Diagramm als auch eine Tabelle sind mögliche Darstellungen der Datenstruktur 
Graph. 

Eine Adjazenzmatrix ist eine spezielle Tabelle, deren Zeilen- und Spaltenindizes jeweils 
durch die Knoten und deren Reihenfolge festgelegt sind. In den Zellen der Tabelle werden 
passend zu den Knotenindizes die Informationen zu den Kanten gespeichert: Falls eine 
Kante zwischen den Knoten existiert, wird bei ungewichteten Graphen eine 1 eingetragen, 
bei gewichteten Graphen das Kantengewicht. 

Eine Adjazenzmatrix kann durch ein zweidimensionales Feld implementiert werden. 


Für das Ablesen 
der Werte aus der 
Matrix merke ich 
mir „Zeile zuerst, 
Spalte später“. 


Ein anderer 


typischer Wert, 
um „keine Kante“ 
anzuzeigen, ist ®, 


ie) 


> lat. adjacere: 
benachbart sein 


lat. matrix: öffentli- 
ches Verzeichnis, 
Stammrolle 
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Informatik ist überall: Entfernungstabellen 
Suchen Sie z. B. im Internet oder in Atlanten verschiedene Arten von Entfernungstabellen. 
a Beschreiben Sie die Intention, warum die Entfernungen in Tabellenform dargestellt wer- 
den. Geben Sie an, warum diese Tabelle keine Adjazenzmatrix ist. 
b Geben Sie für eine dieser Tabellen die Rolle der Knoten des zugrunde 
liegenden Graphen an und beschreiben Sie kurz die Schritte, um eine (<) 
Adjazenzmatrix zu erstellen. 


Adjazenzmatrix erstellen De 
Erstellen Sie für ‚Das Haus vom Nikolaus” die Adjazenzmatrix. A 


Adjazenzmatrix vorgegeben 

Für die folgenden Teilaufgaben ist jeweils eine Adjazenzmatrix vorgegeben. Zeichnen Sie da- 
zu das Diagramm des Graphen. Begründen Sie jeweils, ob es sich um einen gewichteten bzw. 
gerichteten Graphen handelt, und stellen Sie eine allgemeine Regel auf, wie an einer Adjazenz- 
matrix schnell erkannt werden kann, ob ein Graph gewichtet bzw. gerichtet ist. Bearbeiten Sie 
auch die jeweiligen Zusatzaufgaben bei den Teilaufgaben. 


ENEREEREEEH b - En 


Zeichnen Sie den Knoten A in die Mitte. 
Geben Sie für diese Art von Graphen einen 
sprechenden Namen an. 


Es entsteht ein vollständiger Graph. 
Geben Sie eine allgemeine Definition für 
einen vollständigen Graphen an. 


EIN ER ER d EI ERREEENEIE 


Geben Sie für diese Art von Graphen einen 
sprechenden Namen an, der auch von der 
Struktur aus Aufgabe c) abgrenzt. 


Geben Sie für diese Art von Graphen 
einen sprechenden Namen an. 


4 Richtig oder falsch 


1.2 Beziehungen tabellarisch darstellen: Die Adjazenzmatrix 


Geben Sie an, welche Aussagen für den mit der Tabelle 

dargestellten Graphen wahr bzw. falsch sind. 

a Ein Zyklus ist vorhanden. 

b Alle Knoten haben eine Kante auf sich selbst. 

c Es existiert ein Pfad von AnachD. 

d Es existiert ein Pfad von Dnach C viaB. 

e Es gibt einen Pfad von C nach D und wieder zurück, ohne einen weiteren Knoten zu besu- 
chen. 

f Der Graph ist gerichtet. 

g Der Graph ist nicht zusammenhängend. 

h Es gibt einen einfachen Pfad, auf dem man alle Knoten des Graphen besucht. (Einfacher 
Pfad: Pfad, der jeden Knoten höchstens einmal enthält.) 


Klasse GRAPHMATRIX mit Adjazenzmatrix 
Implementieren Sie einen mittels Adjazenzmatrix dargestellten Graphen in der Klasse 
GRAPHMATRIX. 

Feld der Knoten 


knoten: FELD<KNOTEN> die Adjazenzmatrix 


matrix: FELD<FELD<GANZZAHL>> 
kanten: FELD<KANTENSYMBOL> — Feld der Kantensymbole 


KnotenGeben(bezeichner: ZEICHENKETTE) -> KNOTEN 
Gibt den Knoten mit dem angegebenen Bezeichner zurück. 
KnotenBezeichnerGeben(knotenNummer: GANZZAHL) -> ZEICHENKETTE 
Gibt die Bezeichnung eines Knotens mit 


Ausgeben() der gegebenen Knotennummer zurück. 


Gibt die Adjazenzmatrix aus. 
KnotenAnzahlGeben() -> GANZZAHL 
Gibt die Anzahl der Knoten zurück. 


KanteGewichtGeben(von: ZEICHENKETTE, nach: ZEICHENKETTE) -> GANZZAHL 
Gibt die Gewichtung der Kante vom Knoten 
„von“ zum Knoten „nach“ zurück. 


Zurücksetzen() 


N Löscht alle Daten des Graphen. 


Ergänzen Sie dazu das gegebene Projekt wie in den folgenden Teilaufgaben beschrieben. 
Nutzen Sie die oben beschriebenen Attribute und Methoden. 
a Ergänzen Sie im Konstruktor die Initialisierung der (zu- 
nächst leeren) Felder. 
b Ergänzen Sie den Rumpf der Methode 
KnotenEinfügen(bezeichner, x, y) nach folgender Strategie: 
» Hinzufügen eines neuen Knotens mit den gegebenen Da- 
ten an das Feld der Knoten, 
» Erweitern aller Zeilen der Adjazenzmatrix um ein Element 
(„eine weitere Spalte“) mit dem Wert -1 (keine Kante) und 
« Hinzufügen einer neuen Zeile an die Adjazenzmatrix. 
Die Zeile muss die gleiche Elementzahl erhalten wie die bisherigen Zeilen jetzt haben; 
die Elemente der neuen Zeile sollen ebenfalls den Wert -1 erhalten. 


FITEITEIERZJEITEITN 
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Verwenden Sie 
die in Kapitel 1.1 


erzeugten Daten. 
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c Für eine Methode zum Einfügen von Kanten wird zunächst eine interne Hilfsmethode 
KnotenNummerGeben 
benötigt, die den Index 
zu einer gegebenen 
Knotenbezeichnung 
ermittelt (und -1 zu- 
rück gibt, falls dieser 


rückkehrmitwert index 
Implementieren Sie die 


Methode gemäß dem gegebenen Struktogramm. 
d Ergänzen Sie den Rumpf der Methode KanteEinfügen(von, nach, gewichtung) gemäß dem 
gegebenen Pseudocode. 


vonNummer = selbst.KnotenNummerGeben (von) 


zähle index von 0 bis knoten.ElementanzahlGeben() 


knoten.ElementGeben(index).BezeichnerGeben() 
== bezeichner 


nachNummer = selbst.KnotenNummerGeben (nach) 
falls (vonNummer!=-1) UND (nachNummer!=-1) UND 
(vonNummer !=nachNummer) dann 
matrix.ElementGeben (vonNummer).. 
ElementSetzen (nachNummer, gewichtung) 
matrix.ElementGeben (nachNummer) . 
ElementSetzen (vonNummer, gewichtung) 
kante.Hinzufügen (neu KantenSymbol ( 
knoten.ElementGeben (vonNummer) .SymbolGeben (), 
knoten.ElementGeben (nachNummer) .SymbolGeben (), 
falsch, gewichtung, 3, "blau")) 
endefalls 
e Beschreiben Sie die Fehlerfälle, welche die bedingte Anweisung abfängt, im Sachzusam- 
menhang. 


f Testen Sie nun die bisher erstellten Methoden, indem Sie mit Hilfe der Methode 


KnotenEinfügen zwei Knoten z. B. mit den Daten „Ulm, 100, 50“ und „München, 300, 
200” sowie mit der Methode KanteEinfügen die Kanten von Ulm nach München mit 
Gewicht 110 einfügen und verifizieren, dass die Graphik Ihren Angaben entspricht. 


g Mit einem solchen Programm können nun Straßenkarten, U-Bahn-Netzpläne oder Anle- 


gestellen für eine Hausboottour verwaltet und angezeigt werden. Einige Beispiele wur- 
den bereits angelegt. Testen Sie damit die Gesamtfunktion Ihrer Klasse GRAPHMATRIX. 
Erstellen Sie dazu ein Objekt der Klasse BEISPIELE und rufen Sie die Methode Ausführen- 
Abiturfahrt() auf. Kontrollieren Sie stichprobenartig, dass die ausgegebene Adjazenzma- 
trix mit den in der Lehrtextgrafik angezeigten Gewichten und der Tabelle im Lehrtext 
übereinstimmt. 


h Ergänzen Sie nun auch die Rümpfe der folgenden Methoden und testen Sie damit eben- 


falls. Sie können dafür selbstverständlich Ihre in Kapitel 1.1 erstellten Graphen verwen- 
den. 

i Methode AusführenAutobahn() mit „Autobahnen.grdb” 

ii Methode AusführenrFlug() mit „Fluglinien.grdb“ 

iii Methode AusführenICE() mit ICENetz.grdb” 

iv Methode AusführenSUBahn() mit „SUBahn.grdb” 


i Für Schnelle: Testen Sie Ihre Implementierung mit selbst erstellten Beispielen. Sie können 


in die Datenbank auch Fehler einbauen (z. B. falsche Knotenbezeichner) und ausprobie- 
ren, wie Ihr Programm reagiert. 


1.2 Beziehungen tabellarisch darstellen: Die Adjazenzmatrix 


j Für ganz Schnelle: Die Graphendaten können auch in einer Textdatei gespeichert werden. 
Das Programm zum Erstellen der Graphen kann auch in eine solche Datei speichern; die 
entsprechende Lesemethode LesenDatei(name) ist in der Klasse LESEN bereits vorbereitet. 
Testen Sie auch mit dieser Variante (die Dateinamen enden auf .grph). Vergleichen Sie die 
beiden Lesemethoden und geben Sie begründet an, welche Variante Sie vorziehen. 


6 Zwei- und mehrdimensionale Felder 


“7 


Mehrdimensionale Felder sind keine eigenständigen Datenstrukturen, sondern nur eine spe- 
zielle Anwendung von Feldern. Das erste Feld hat als Datenelemente wieder Felder usw. Erst 
die Elemente des letzten (innersten) Feldes enthalten die eigentlichen Daten. 

a Erstellen Sie eine Multiplikationstabelle, d. h. ein zweidimensionales Feld, dessen Elemen- 
te das Produkt aus Zeilen- und Spaltenindex enthalten. Geben Sie den Inhalt des Feldes 
auf der Konsole aus. 

b Bei der Speicherung ungerichteter Graphen in 
Adjazenzmatrizen wird durch Redundanz viel 
Speicherplatz ‚verschwendet‘, da ja alle Informa- 
tion bereits im Dreieck unterhalb der Diagonalen 
(siehe Bild rechts) enthalten ist. Es genügt also, 
nur diese sogenannte untere Dreiecksmatrix zu 
speichern. Das Feld der ersten Zeile hat dann die 
Länge 1, das Feld der zweiten Zeile die Länge 2 
usw. Nur das Feld der letzten Zeile hat die volle Länge n. Der abgebildete Graph stellt aus- 
schnittsweise dar, wie viele Beiträge in einem sozialen Netzwerk von diesen beiden Usern 
kommentiert wurden. 

i Erstellen Sie diese Dreiecksmatrix mit der Vor- 
besetzung -1 für alle Feldelemente und wei- 
sen Sie dann die Gewichte für die verbunde- 
nen Knoten zu. 

ii Geben Sie den Inhalt auf der Konsole aus. Er WM 
iii Für Schnelle: Implementieren Sie eine Metho- Ey 78 121 _1 I 98 | 1 

de, die bei Angabe von Zeilen- und Spaltenin- 
dex (in beliebiger Reihenfolge!) den entsprechenden Wert aus der Dreiecksmatrix ausgibt. 

c Für Schnelle: Erstellen Sie ein Pascalsches Dreieck der Höhe 10 und anschließend eine Pas- 

calsche Pyramide der Höhe 10. Letztere benötigt dreidimensionale Felder. 


Klasse GRAPHLISTE mit Adjazenzlisten - Version 1 

Gibt es in einem Graphen viele Knoten, aber nur relativ wenige Kanten, so äußert sich das in 

Form von vielen „leeren“ Zellen in der Adjazenzmatrix. Man spricht dann von einem,dünnen” 

Graphen. Bei der Speicherung des Graphen mit Hilfe einer Adjazenzmatrix wird in diesen Fäl- 

len sehr viel Speicherplatz verschwendet. 

Eine Möglichkeit, mit dieser Situation speichersparend umzugehen, ist die Verwendung soge- 

nannter Adjazenzlisten. Hier wird bei jedem Knoten ein Feld mit den von diesem Knoten aus- 

gehenden Kanten gespeichert; als Kantenattribute sind in diesem Fall nur das Gewicht der 

Kanten und eine Referenz auf deren Zielknoten nötig. 

a Implementieren Sie die für diese Darstellung nötigen Klassen GRAPHLISTE, KNOTEN und 
KANTE. 

b Für Schnelle: Erweitern Sie die Klasse GRAPHLISTE um eine Methode 
Umwandeln(FELD<FELD<GANZZAHL>>), die aus einem übergebenen Objekt der Klasse 
GRAPHMATRIX die Adjazenzmatrix ausliest und damit die Adjazenzlisten aufbaut. 
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1.3 Die Knoten systematisch besuchen: Breitensuche 


Für eine Show platziert ein Feuerwerker Raketen in (nummerierten) Abschussrohren; je größer 
die Nummer, desto größer die Rakete. Manche Raketen sind untereinander mit immer gleich 
langen Zündschnüren verbunden. Der Abschuss einer Startrakete führt A) 
dazu, dass alle direkt verbundenen Raketen ausgelöst wer- 
den („Welle I”), dann all deren direkte Nachbarn (‚Welle II) 
usw. Zur Sicherheit werden teilweise mehrfache Verbindun- 
gen gelegt, falls eine Zündschnur nicht funktionieren sollte. 
a Beantworten Sie die folgenden Fragen: 
i_ Wie viele Raketen starten in Welle I, wenn 1 die 
Startrakete ist? 
ii In welcher Welle wird Rakete 11, in welcher 22 
und in welcher 14 gezündet, wenn 1 die Start- 
rakete ist? 
iii Nennen Sie die Startrakete, wenn in Welle Ill u. a. die Raketen 11 und 24 starten. 


b Der Auszubildende Klaus möchte her- ©) 
ausfinden, wie lange es dauert, biseine (18 Sekunden! Da der Weg von 1 via < 
Zündschnur abbrennt. Er kennt die 25 und 11 zu 23 über 3 Kanten führt, 

dauert das Abbrennen einer Zündschnur 


Dauer ab dem Abschuss der Startrakete | oc 6 mann 
1 bis zum Start von Rakete 23. Beziehen 
Sie zu Klaus’Vermutung Stellung. 

c Für Schnelle: Für eine Choreografie 
wird die Längen der Zündschnüre variiert, was ein verändertes Startverhalten zur Folge 
hat: 

« Innerhalb einer Gruppe von Nachbarraketen (von 1 z.B. 9, 12, 20, 25) starten die Ra- 
keten nacheinander in aufsteigender Reihenfolge. Während eine Gruppe von Nach- 
barraketen startet, starten keine anderen Raketen. 

« Die Gruppen starten nacheinander in der Reihenfolge, in der zuvor auch ihre „Mut- 
terraketen” gestartet sind. 

Geben Sie die Reihenfolge an, in der die Raketen bei Startrakete 1 nun starten würden. 


Grundidee für kurze Wege 
In vielen Anwendungen werden Algorithmen verwendet, die den kürzesten Weg von einem Ort 
zu einem anderen Ort suchen: Navigationsgeräte in Autos, die Kartenapp auf dem Handy, Online- 
Kartendienste und auch Computerspiele, beidenen derComputer die Gegner steuert. Dilara und 
Sven wollen herausfinden, wie ein solcher Algorithmus funktionieren könnte, der in einem Gra- 
phen (der Landkarte) den kürzesten Weg von einem Knoten zu 
einem anderen findet. 

Zuerst zeichnen sie sich einen hinreichend großen Graphen, an 
dem sie ihre Ideen durchspielen können, und markieren willkür- 
lich einen Start- und einen Zielknoten (J bzw. S). 

Sie überlegen: alle Knoten, die man vom Startknoten aus errei- 
chen kann, sind genau eine Kante weit weg. Wenn man von 
diesen Knoten aus wieder alle weiteren erreichbaren sucht, sind 
diese genau zwei Kanten weit weg. Setzt man dieses Vorgehen 
so lange fort, bis man den Zielknoten erreicht, erhält man den 
Pfad mit den wenigsten Kanten. 

Im ersten Schritt sind vom Startknoten J aus (rot als aktueller 
Knoten markiert) die Knoten C, | und K direkt erreichbar. 


1.3 Die Knoten systematisch besuchen: Breitensuche 


Diese Knoten markieren sie gelb und merken sie sich zusätzlich in einer „To-Do-Liste“, damit sie 
später nicht vergessen, auch all deren Nachbarn in der richtigen Reihenfolge zu besuchen. J ist 
fertig behandelt. 

Danach wählen sie C und sehen, dass von dort aus die Knoten B und D erreichbar sind (Bild unten 
links). Der Reihe nach betrachten sie nun auch die Nachbarn der Knoten | und K. Damit sind alle 
Knoten abgearbeitet, die über eine Kante vom Start aus erreichbar sind. Wie erwartet stehen nun 
in der To-Do-Liste genau die Knoten, die von J aus zwei Kanten entfernt sind (Bild unten Mitte). 


Beim weiteren Abarbeiten ihrer To-Do-Liste stellen Dilara und Sven fest, dass von B aus gar kein 
neuer Knoten erreichbar ist, und dass meist nur wenige Knoten neu erreichbar sind. Als sie den 
Knoten N fertig bearbeitet haben, ist dieTo-Do-Liste kaum größer als zu Beginn (Bild obenrechts). 


Eifrig machen sie so lange 
weiter, bis der Knoten S der 
aktuelle Knoten wird. Ihre 
Arbeit ist damit beendet. 


Da der Algorithmus die Knoten >konzentrisch um den Startknoten inimmerbreiterenBereichen > konzentrisch: um 

abarbeitet (siehe Bilder), wird dieser Algorithmus Breitensuche genannt. eine gemeinsame 
Mitte angeordnet 

Der Algorithmus zusammengefasst 

Da Dilara und Sven nun sicher sind, dass ihre Vorgehensweise funktioniert, formulieren sie den 

zugehörigen Algorithmus unter der Voraussetzung, dass die Kanteninformation in einer Adja- 

zenzmatrix abgespeichert ist. Zur Umsetzung der Warteliste und zur Kennzeichnung der fertigen 

Knoten verwenden sie passende Felder. 


warteliste.Leeren() nah: . 
fertigeKnoten.Leeren() Initialisierung für den Algorithmus 
aktuellerKnoten = startKnoten 


wiederhole solange nicht aktuellerKnoten == zielKnoten 
zähle nummer von 0 bis anzahlKnoten - 1 


(matrix.ElementGeben(aktuellerKnoten).ElementGeben(nummer) > 0) und 


(nicht fertigeKnoten.Enthält(nummer)) und 
(nicht warteliste.Enthält(nummer)) 


warteliste.Anfügen(nummer) 


fertigeKnoten.Anfügen(aktuellerKnoten) 
aktuellerKnoten = warteliste.ElementGeben(0) 
warteliste.Entfernen(0) 
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Andere Ergebnisse 

Dilara und Sven überlegen weiter, was passiert, wenn der Zielknoten gar nicht erreichbar ist. In 
diesem Fall wäre die Warteliste leer, noch ehe der Zielknoten gefunden ist. Das müsste im Algo- 
rithmus noch überprüft werden. 

Mit einer leeren Warteliste als Endbedingung kann der Algorithmus auch überprüfen, ob ein 
Graph zusammenhängend ist: Es muss dann nur noch überprüft werden, ob die Anzahl der fer- 
tigen Knoten gleich der Gesamtzahl der Knoten ist. 

Statt eines fest vorgegebenen Zielknotens kann auch nach einem Knoten mit bestimmten Eigen- 
schaften gesucht werden (Es gibt dort ein Freibad, in dem Kino läuft ein bestimmter Film etc.). 
Der Algorithmus liefert dann den Knoten mit dieser Eigenschaft, der über die wenigsten Kanten 
erreichbar ist (oder eine leere Referenz, wenn kein Knoten mit der gewünschten Eigenschaft 
erreichbar ist). 


Die Breitensuche besucht von einem Startknoten aus systematisch in konzentrischen Be- 
reichen um den Startknoten alle (erreichbaren) Knoten eines Graphen. 

Mit der Breitensuche kann auch ein bestimmter Knoten gesucht werden; dieser Knoten wird 
auf dem Pfad mit der geringsten Kantenanzahl gefunden. Es kann außerdem geprüft wer- 
den, ob ein Graph zusammenhängend ist. 


Aufgaben 


== 


== Qi ’ 


Informatik ist überall: Ich kenne jemanden, der jemanden kennt ... 

a Begründen Sie, warum Sie mit Hilfe der Breitensuche in sozialen Medien optimal nach 
einer Person mit einer bestimmten Eigenschaft (hat ein bestimmtes Hobby, wohnt an 
einem bestimmten Ort ...) suchen können. Geben Sie dazu an, welcher Wert hier opti- 
miert wird. 

b Bei der Ermittlung der Bacon-Zahl in Kapitel 1.1, Aufgabe 12b) kann die Breitensuche gut 
verwendet werden. Erstellen Sie aus den Ergebnissen von 12b) den Bekanntheitsgraphen 
und ermitteln Sie mit Hilfe der Breitensuche die Bacon-Zahl eines von Ihnen gewählten 
Schauspielers. 


Breitensuche durchführen 

Gegeben ist der nebenstehende Teil des 
Münchner Schnellbahnnetzes. Ermitteln Sie 
mit Hilfe der Breitensuche, wie viele Stationen 
auf dem Weg vom Sendlinger Tor zum Inns- 
brucker Ring mindestens erreicht werden. 
Führen Sie die Breitensuche zu zweit mit Pa- 
pier und Bleistift aus. Nutzen Sie dabei eine 
Tabelle wie auf der nächsten Seite als Beispiel 
angegeben; achten Sie dabei insbesondere 
auf eine sorgfältige Notation der To-Do-Liste. 
Eine Person führt die Suche durch, die zweite 
beobachtet und stoppt bei eventuellen Feh- 
lern (wie beim Pair-Programming). In einem 
zweiten Durchgang wechseln Sie Ihre Aufga- 
ben und ermitteln die Bahnhofsanzahl vom 
Sendlinger Tor nach Moosach. 


EEE Er 


Obersendling Fürstenried-West(1), Harras(1), Implerstraße(1) 
— Fürstenried-West 1 Harras(1), Implerstraße(1) 
| Harras 1 Implerstraße(1), Großhadern(2), Heimeranplatz(2) 
| Implerstraße 1 Großhadern(2), Heimeranplatz(2), Sendlinger Tor(2) 
| Großhadern 2 Heimeranplatz(2), Sendlinger Tor(2) 
Fr Heimeranplatz 2 Sendlinger Tor(2), Donnersberger Brücke(3), Hbf(3), Laimer 
Platz(3) 


Beispiel: Mindestanzahl von Stationen bei der Fahrt von Obersendling zum Heimeranplatz 


Breitensuche implementieren 

Ergänzen Sie das gegebene Projekt um den Algorithmus zur Breitensuche. Die Teilaufgaben 

geben dabei Details vor. 

a Ergänzen Sie die Felder für die Warteliste und die Verwaltung der fertigen Knoten. 

b Ergänzen Sie die Methode BreitensucheAusführen(startKnoten: GANZZAHL, zielKnoten: 
GANZZAHL). Verwenden Sie dazu den im Lehrtext gegebenen Algorithmus. 

c Testen Sie den Algorithmus zunächst mit einem Graphen, der einen geeigneten Zielkno- 
ten enthält. 

d Testen Sie den Algorithmus nun mit einem Graphen, der keinen geeigneten Zielknoten 
enthält. Überlegen Sie dabei zuerst, welches „Ergebnis“ Sie erwarten, und vergleichen Sie 
das beobachtete Ergebnis mit Ihren Überlegungen. 

e Für Schnelle: Ergänzen Sie den Algorithmus so, dass auch für den Testfall aus Teilaufgabe 
d) kein Fehler mehr auftritt und dass die Methode BreitensucheAusführen einen Wahrheits- 
wert zurückgibt, der genau dann wahr ist, wenn ein Zielknoten gefunden wurde. 


Breitensuche und Test auf Zusammenhang 

In einer leicht abgewandelten Form in der Wiederholungsbedingung testet die Breitensuche, 
ob ein Graph zusammenhängend ist. Ergänzen Sie das gegebene Projekt um diesen Algorith- 
mus. Die Methode Zusammenhanglesten() soll keine Parameter besitzen und als Ergebnis 
WAHR zurück melden, wenn der Graph zusammenhängend ist. 


Knoten mit einer bestimmten Eigenschaft suchen 

Navigationsgeräte oder Online-Kartendienste sind auch in der Lage, den Weg zur nächstgele- 

genen Tankstelle, zu einem Schnellimbiss usw. zu finden. Dazu muss nur die Wiederholungs- 

bedingung der Breitensuche angepasst werden: Statt zu wiederholen, bis der aktuelle Knoten 
gleich dem Zielknoten ist, muss wiederholt werden, bis der aktuelle Knoten eine bestimmte 

Eigenschaft hat. 

Im gegebenen Projekt ist bei den Knoten zusätzlich das Attribut tankstelleVorhanden mit den 

Werten WAHR oder FALSCH gespeichert sowie eine Methode IstTankstelleVorhanden() ergänzt, 

die den Wert dieses Attributs zur Verfügung stellt. 

a Ändern sie in der Methode BreitensucheAusführen der Klasse GRAPHMATRIX die Wieder- 
holungsbedingung so ab, dass die Suche beendet wird, wenn ein Knoten mit Tankstelle 
gefunden wurde. 

b Testen Sie Ihre Lösung mit der Suche von verschiedenen Startpunkten aus. 

c Für Schnelle: Ergänzen Sie in der Datenbank und im Programm noch ein weiteres Knoten- 
attribut (z. B. Schnellimbiss), so dass auch der kürzeste Weg zu einem Knoten mit dieser 
Eigenschaft ermittelt werden kann. 


Dr 


Do 
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© Ri = & 6 Umfüllprobleme Teil 2 


In Aufgabe 10 in Kapitel 1.1 wurden verschiedene Umfüllprobleme betrachtet und der Graph 
jeweils so weit erstellt, bis eine gesuchte Lösung erreicht wurde. Wenn der vollständige Graph 
für das jeweilige Problem erstellt wird, kann mit Hilfe der Breitensuche ermittelt werden, ob 
eine bestimmte Flüssigkeitsmenge erreicht werden kann. 

a Das bereitgestellte Projekt enthält die Klassen GRAPHA bzw. GRAPHB, welche die Struktur 
für die Graphen der Teilaufgaben a) bzw. b) der Aufgabe 10 in Kapitel 1.1 aufbauen und 
anzeigen. Ergänzen Sie die Klasse KNOTEN um eine Methode 
IstFüllmengeVorhanden(füllmenge:GANZZAHL)->WAHRHEITSWERT, 
die genau dann WAHR zurückmeldet, wenn einer der drei Eimer in diesem Zustand die 
gewünschte Füllmenge enthält. 

b Ergänzen Sie in der Klasse GRAPHMATRIX eine Methode zur Breitensuche in der Form, 
dass sie mit Rückgabewert WAHR beendet wird, wenn ein Knoten gefunden wurde, bei 
dem ein Eimer die gewünschte Füllmenge enthält. Wird kein solcher Knoten gefunden, 
wird FALSCH zurückgegeben. 

c Für Schnelle: Geben Sie an, welche Füllmengen prinzipiell erreicht werden können, und 
ergänzen Sie die Klassen GRAPHA bzw. GRAPHB und eine Methode AllesPrüfen(), die prüft, 
ob diese Füllmengen auch tatsächlich erreicht werden können. 


Breitensuche optimieren 

Es kostet Rechenzeit, um nachzusehen, ob ein Knoten schon fertig bearbeitet ist, genauso wie 

nachzusehen, ob ein Knoten in der Warteliste (To-Do-Liste) ist. Eine mögliche Alternative ist, 

beim Knoten ein Statusattribut mit den Werten „unbearbeitet“, ‚inWarteliste“, „fertig“ und „ak- 

tuell” anzulegen. 

a Begründen Sie, warum die Warteliste trotzdem weiter nötig ist. 

b Ändern Sie den Algorithmus zur Breitensuche in Ihrem Projekt entsprechend ab. 

c Begründen Sie, warum ein solches Attribut Rechenzeit spart. 

d Für Schnelle: Der Test, ob der Graph zusammenhängend ist, kann nun nicht mehr direkt 
über die Länge des Feldes der fertigen Knoten angegeben werden. Beschreiben Sie eine 
mögliche Alternative und implementieren Sie diese. 


Klasse GRAPHLISTE mit Adjazenzlisten - Version 2 

Übertragen Sie die Implementierung der Breitensuche auf die Darstellung des Graphen durch 
Adjazenzlisten. Bewerten Sie, ob Ihnen die Darstellung über die Adjazenzmatrix oder die Dar- 
stellung über Adjazenzlisten geeigneter erscheint. 


10 Rasenmähroboter 


Vor langer Zeit hatten die Samurai in Japan ein Netz von 

Signalstationen aufgebaut. Um im Notfall das ganze Land 

zu alarmieren, konnten auf den Stationen Signalfeuer ent- 

zündet werden. Im Bild rechts sind die Signalstationen als 

Kreise gezeichnet. Stationen, die mit einer Linie verbunden 

sind, sind Nachbarn. 

Wird auf einer Station ein Signalfeuer entzündet, sehen die 

Nachbarn das Feuer nach einer Minute und zünden selbst 

sofort ein Signalfeuer an. Nach einer weiteren Minute zün- 

den also auch die Nachbarn der Nachbarn ein Signalfeuer 

an. Und so gehtes weiter, bis auf allen Stationen ein Signalfeuer entzündet ist. Eines Tages wird 

auf der Station im Hauptquartier (der größere schwarze Kreis) ein Signalfeuer entzündet. 

a Nennen Sie die Dauer in Minuten, bis auf allen Signalstationen ein Signalfeuer entzündet 
wurde. 

b Erklären Sie den Zusammenhang der Aufgabe zur Breitensuche und begründen Sie damit 
Ihr Ergebnis aus a). 

c Begründen Sie, dass sich durch eine Verlegung des Hauptquartiers die maximale Signal- 
dauer (d.h. die Zeit, bis auch auf der letzten Signalstation ein Feuer entzündet wird) ver- 
ringern lässt. Nennen Sie die minimale Dauer und die dazu passende(n) Position(en) des 
Hauptquartiers. 


Rasenmähroboter mähen eine Grasfläche mit zu- 

fälligen Bewegungen ab. Damit das funktioniert, 

muss die zu mähende Fläche zusammenhän- 
gend sein, denn der Roboter kann nicht über We- 
ge fahren oder Büsche durchdringen. 

Um zu testen, ob ein gegebener Rasen gemäht 

werden kann, unterteilt man die ganze Fläche in 

Quadrate in der Größe des Mähers. Grüne Quad- 

rate stellen Rasen dar, braune Quadrate Hinder- 

nisse wie Büsche, Wege usw. Aus diesen Quadra- 
ten bildet man nach dem folgenden Ansatz einen Graphen: 

« Jedem grünen Quadrat entspricht ein Knoten. 

« Sind zwei grüne Quadrate benachbart, wird im Graph eine Kante zwischen den entspre- 
chenden Knoten eingetragen. 

a Öffnen Sie das Vorlagenprojekt und lassen Sie sich die gegebene Rasenfläche Rasen1.txt 
sowie den zugehörigen Graph durch Erzeugen eines Objekts der Klasse RAHMEN anzei- 
gen. Der Dateiname wird im Konstruktor angegeben. 

b Ergänzen Sie in der Klasse GRAPHMATRIX den Rumpf der Methode 
Zusammenhanglesten(). Ergänzen Sie weiter in der Klasse RAHMEN eine Methode 
ZusammenhangPrüfen(), die mit Hilfe der Methode Zusammenhanglesten() prüft, ob die 
Rasenfläche vollständig gemäht werden kann, und eine entsprechende Meldung aus- 
gibt. 

c Testen Sie Ihre Lösung mit den Dateien Rasen1.txt und Rasen2.txt. Die erste Fläche ist 
zusammenhängend, die zweite nicht. 

d Für Schnelle: Entwerfen Sie eigene Rasenflächen - Sie können die Dateien direkt in der 
Entwicklungsumgebung editieren - und testen Sie damit Ihre Lösung. 


KERA 
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11 Workshops mit Zulassungsvoraussetzung 


Die Schule bietet unter dem Motto „Digitale Wochen“ jede Woche kleine Video-Workshops 
zu spannenden Themen wie Graphikbearbeitung, Videoerstellung, Animationserstellung, 
Drohnenprogrammierung usw. an. 

Die Zulassungsbeschränkung mancher Workshops ist durch die gerichteten Kanten model- 
liert: Um den Workshop absolvieren zu dürfen, muss man mindestens einen der Vorgänger- 
workshops besucht haben; und dies muss bereits in einer Vorwoche und nicht erst in dersel- 
ben Woche geschehen sein. Mit gültiger Zulassung können beliebig viele Workshops 
innerhalb einer Woche besucht werden. 


m — 
dd Workshop? kann man 
< N beispielsweise sofort 


besuchen und in derselben 
Woche auch noch W13, 
W4 kann man erst 


\ ab Woche 2 besuchen 
und muss vor dieser 
Woche entweder W1 oder 
W13 (oder beide) als 
Zulassungsvoraussetzung 
absolviert haben. 


a Martina besucht Workshop 3. Geben Sie alle möglichen Abfolgen an, wie sie hierfür 
Workshops in den Vorwochen besucht haben könnte. 

b Finden Sie heraus, wie lange die digitalen Wochen sinnvollerweise mindestens dauern 
müssen, und begründen Sie Ihr Ergebnis. 

c Geben Sie die jeweiligen Längen der kürzesten Pfade zu den fünf Endknoten” an. Erklä- 
ren Sie, welche Bedeutung das Maximum der Werte im Sachzusammenhang hat. 

d Für Schnelle: Durch zusätzliche Zulassungsvoraussetzungen können Zyklen im Graph 
entstehen. Ergänzen Sie eine beliebige Kante, die zu einem Zyklus führt, so, dass ... 
i ... trotzdem noch alle Workshops absolviert werden können. 


ii... nicht mehr alle Workshops absolviert werden können. 


12 Labyrinth durch Abstraktion lösen 


In einem Rätselheft ist der Bauplan eines dreistöckigen Labyrinths abgebildet. Die weißen 
Felder bilden die Gänge. Auf den Feldern mit Pfeil geht man zum nächsten Feld in Richtung 
des Pfeils. 

Weiterhin existieren besondere Wegknotenpunkte: 


[Symbol | Bedeutung 


Man fällt durch ein Loch zum darunterliegenden Feld eine/zwei Etagen tiefer. 


Man fährt mit dem Aufzug zum darüberliegenden Feld eine/zwei Etagen höher. 


= Stahltür, dort geht es nicht weiter 
Untergeschoss Erdgeschoss Obergeschoss 

olol-/elcr lee E 
T o-ecei@@r EN 
r viel-l2 T 
>/>|>|>|> > Oo Jo T 
[IT a T 
'Ia>>>>>>111 RT 
r)elej- oO 4% 


Der Bauplan zeigt vier nummerierte Eingänge und in der unteren Etage einen rot dargestell- 
ten Ausgang, allerdings ist dieser nur von einem Eingang aus erreichbar. 

Die Lösung in der Darstellung des Rätselhefts zu finden ist mühsam. Abstrahieren Sie die 
gesamte Darstellung zu einem einzigen Graphen und ermitteln Sie damit, welcher Eingang 
der ist, der auch wieder hinaus führt. 

Hinweise: 

« Modellieren Sie nur die oben beschriebenen Wegknotenpunkte als Knoten. 

« Einzelne aufeinanderfolgende Pfeile können zu einer Kante zusammengefasst werden. 
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1.4 Mit Graphen Probleme lösen: Anwendungen der Breitensuche 


Beim Nim-Spiel haben die Spieler „Weiß*“ und „Schwarz“ fünf beliebige 
Gegenstände vor sich. „Weiß“ beginnt immer. Die Spieler nehmen im 
Wechsel entweder einen oder zwei Gegenstände weg. Wer den letz- 
ten Gegenstand wegnimmt, hat verloren. 

a Spielen Sie das Spiel zu zweit fünfmal. 

Der Graph rechts stellt alle möglichen Spielverläufe dar. A ist 

der Startknoten, alle 5 Gegenstände sind noch da, „Weiß“ 

zieht. 

b Diskutieren Sie anhand des Graphen, ob es eine sichere Gewinnstrategie für „Weiß“ 
gibt. (Für Schnelle: auch für Schwarz“) 

c Josephine möchte mit einem Programm Gewinnstrategien für „Weiß“ ermitteln und 
dazu den Graphen mit einer Breitensuche durchlaufen. Damit sie nachträglich für einen 
gefundenen „Gewinnknoten“ die zugehörige Spielstrategie ableiten kann, muss sie 
+ für jeden Knoten eine Überprüfung vornehmen, damit klar ist, ob es sich überhaupt 

um einen Gewinnknoten handelt, 
« und für jeden Knoten eine zusätzliche Information speichern, damit der zugehörige 
Pfad ermittelt werden kann. 
Geben Sie an, woran ein Gewinnknoten im Programm erkannt werden kann und welche 
Information zusätzlich gespeichert werden muss. 


Den Weg markieren 

Imnächsten SchrittwollenDilara und Sven 
ihren Algorithmus zur Suche des Zielkno- 
tensnunsoergänzen, dassernichtnurden 
Zielknoten findet, sondern auch den Pfad 
dorthin angibt. Dilara meint, dazu müsste 
nur bei jedem Knoten gespeichert wer- 
den, von welchem Knoten aus man zu die- 
sem Knoten gekommen ist. Wenn man 
den Zielknoten erreicht hat, geht man ein- 
fach nur diese Vorgänger zurück zum 
Startknoten. 

Dieses Verfahren probieren die zwei in ih- 
rem Beispiel aus, indem sie beim Knotenna- 
men auch noch den Vorgängernamen no- 
tieren. Auch die Anzahl der Knoten bis zum 
Startknoten (Entfernung) geben sie mit an. 
Nachdem sie die Knoten, die vom Start- 
knoten J aus direkt erreichbar sind, abge- 
arbeitet haben, ergibt sich das obere Bild. 
Die Situation kurzbevor der gesuchte Kno- 
ten erreicht wird, ist im unteren Bild ge- 
zeigt. An den Entfernungsangaben ließe 
sich auch ohne die eingezeichneten Kreise 
gut erkennen, dass die Breitensuche 
„kreisförmig” arbeitet. 


1.4 Mit Graphen Probleme lösen: Anwendungen der Breitensuche 


Den Weg angeben 

Mit Hilfe der gespeicherten Vorgänger- 
knoten lässt sich der Pfad vom Knoten mit 
der gewünschten Eigenschaft zum Start- 
knoten leicht ablesen: 

S-R-N-K-)J 

Dilara und Sven erhalten also das Ergebnis, 
das sie benötigen, nämlich die genaue 
Fahrstrecke. 


Der Algorithmus 

Mit den bisherigen Überlegungen können Dilara und Sven nun den vervollständigten Algorith- 

mus angeben. Dabei setzen sie voraus, dass ein Knoten zwei zusätzliche Attribute besitzt: 

» länge zur Angabe der Weglänge bis zu diesem Knoten und 

» Vorgänger für die Nummer des Vorgängerknotens, wobei -1 für hat keinen Vorgänger” 
steht. 


warteliste.Leeren() 
fertigeKnoten.Leeren() 


kı 

aktuellerKnoten = startKnoten 

wiederhole solange nicht aktuellerKnoten == zielKnoten 
zähle nummer von 0 bis anzahlKnoten - 1 


(matrix.ElementGeben(aktuellerKnoten).ElementGeben(nummer) > 0) und 
(nicht fertigeKnoten.Enthält(nummer)) und 
nicht warteliste.Enthält(nummer)) 


warteliste.Anfügen(nummer) 


Mit einer erweiterten Breitensuche kann man sowohl die Länge des Pfads (als Anzahl der 
auf dem Weg durchlaufenen Kanten) von einem Startknoten zu einem Knoten mit einer 
gewünschten Eigenschaft angeben als auch die Folge der Knoten auf diesem Pfad. 


Yo 


Der Startknoten 
„J" hat keinen 
Vorgänger- 
knoten. 


Nur die gelb 
hinterlegten 
Teile sind 
neu. 
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a Ergänzen Sie die angegebenen Attribute bei der Klasse KNOTEN. Implementieren Sie auch 
die zugehörigen Getter- und Setter-Methoden, damit sie die Attribute selbst auf privaten 
Zugriff einschränken können. 

b Ergänzen Sie in der Methode BreitensucheAusführen die neuen Teile nach dem im Lehrtext 
gegebenen Algorithmus. 

c Testen Sie den Algorithmus zunächst mit einem Graphen, der einen geeigneten Zielkno- 
ten enthält. 

d Testen Sie den Algorithmus nun mit einem Graphen, der keinen geeigneten Zielknoten 
enthält. Obwohl der ursprüngliche Algorithmus dafür bereits abgesichert ist, kommt es zu 
einer Fehlermeldung. Interpretieren Sie diese, geben Sie an, wodurch der Fehler ausgelöst 
wurde, und ergänzen Sie geeignete Bedingungen zur Vermeidung des Fehlers. Ergänzen 
Sie auch eine entsprechende Ausgabe. 

e Für Schnelle: Ergänzen Sie den Algorithmus so, dass die Knoten in der Reihenfolge vom 
Startknoten zum Zielknoten ausgegeben werden. 

Tipp: Speichern Sie die Knotennamen in einem geeigneten Feld zwischen. 


3 Erweiterte Breitensuche implementieren 
Aufgaben Ergänzen Sie das gegebene Projekt um den erweiterten Algorithmus zur Breitensuche. Die oo 
R 1 Informatik ist überall: Breitensuche in Computerspielen Telaurppbengebentdanel Depalls vor 


In vielen Computerspielen werden die Computergegner taktgesteuert (also nach einem be- 
stimmten Zeitintervall) in einer Welt aus quadratischen Kästchen bewegt - pro Zug ein Käst- 
chen nach links, rechts, oben oder unten. Für die Bewegung wird jedem betretbaren Kästchen 
ein Knoten zugeordnet und die Knoten verbundener, direkt benachbarter Kästchen werden 
durch Kanten verbunden. 
In diesem Spiel sind die hellbraunen Kästchen Land 
und können von den Figuren betreten werden; geht 
die Kante zwischen zwei Kästchen über Land, so sind 
diese Kästchen verbunden, z.B. von der Stadt A aus 
können alle vier benachbarten Kästchen erreicht wer- 
den, von der Stadt B aus kann eine Figur nur nach Nor- 
den oder Westen gehen. Weiter gibt es in diesem Spiel 
„Schnellverbindungen‘“: von jedem der rot markierten 
Kästchen aus kann eine Figur auch in einem Zug in ein anderes Kästchen mit einer roten Mar- 
kierung gelangen. 
a Erstellen Sie den Graphen für die Bewegung einer Figur an Land. Verwenden Sie kariertes a z 
Papier und markieren Sie die ae . die Sie dann mit passenden Linien ENROBRUh IN Labyriiieh OQ A a KR 
verbinden können. 
b Ermitteln Sie per Breitensuche einen kürzesten Weg von A nach B für eine Figur. 
c Für Schnelle: Ermitteln Sie einen kürzesten Weg von A nach B ohne Benutzung der 
Schnellverbindungen. 


Den Ausgang aus einem Labyrinth zu finden, ist nicht einfach. In einem Mythos der Antike 

fand Theseus mit Hilfe eines Fadens, den ihm die Prinzessin Ariadne geschenkt hatte, wieder © 
aus dem Labyrinth des Minotaurus. Auch mit Hilfe der Breitensuche findet man immer den 
kürzesten Weg nach draußen, wenn man das Labyrinth als Graphen modelliert. 

Bei einem Labyrinth in einer 2D-Spielewelt ist der Zusammenhang zwischen Welt und Graph 
besonders einfach. Die Welt besteht aus Quadraten, gespeichert in einem zweidimensionalen 

Feld. Weiße Quadrate sind begehbar, schwarze Quadrate sind Wände. Das Ziel ist grün darge- 

stellt (linkes Bild). Im entsprechenden Graphen ist jedem begehbaren Feld ein Knoten zuge- 

ordnet und je zwei benachbarten Knoten eine Kante. 


ns [6) 2 Erweiterte Breitensuche durchführen 

N Führen Sie methodisch analog zur Aufgabe 2 
aus Kapitel 1.3 die erweiterte Breitensuche 
aus. Ermitteln Sie damit (analog zum unten 
gegebenen Beispiel) denWeg vom Sendlinger 
Tor zum Innsbrucker Ring bzw. nach Wechsel 
ihrer Aufgaben vom Sendlinger Tor nach 
Moosach. Die Tabelle müssen Sie dazu umeine 
Spalte Vorgänger ergänzen (und diesen Vor- 
gänger auch in der To-Do-Liste mitführen). 


D.. 
Fürstenried- Obersendling 6... Giesing Süd 
West K 

M 


a Starten Sie das Programm durch Erzeugen eines Objekts der Klasse TEST. Blenden Sie ab- 


| schritt | station | Anz. | To-Do-Liste wechselnd Labyrinth und Graph ein und aus (GraphAnzeigen() bzw. LabyrinthAnzeigen()), 


j Fürstenried-West (1,05), Harras (1,08), um die Korrespondenz der beiden Darstellungen zu überprüfen. 
Obersendling u "| Implerstraße (1,05) b Erkunden Sie die Klasse RAHMEN. Beschreiben Sie insbesondere, wie die Methode 
nr Fürstenried-West 1 0S Harras (1, OS), Implerstraße (1, OS) BreitensucheAusführen verwendet wird. 
c Ergänzen Sie in der Klasse GRAPHMATRIX den Rumpf der Methode BreitensucheAusführen. 
en 1 05 Implerstraße (1, OS), Großhadern (2, Har), ie fü A & 
Heimeranplatz (2, Har) d Testen Sie für mehrere Startpositionen den Weg von Theseus aus dem Labyrinth durch 
Großhadem (3, Hatl, Heimeranplatziz Hal) den Aufruf der Methode TheseusPositionieren() und FluchtwegBerechnen)). u 
Implerstraße 1 05 Sendlinger Tor (2, 15) e Für Schnelle: Bei den einzelnen Methoden wird noch nicht abgeprüft, ob sie in der richti- 
BE Bohnen 5 Har- | tieimeranpiste@. Han Sendiingerfarfä,] gen Reihenfolge ausgeführt werden. Ergänzen Sie die entsprechenden Tests sowie eine 
p ante 9 ö Methode FluchtAusführen(), die Theseus positioniert und den Fluchtweg ermittelt. 
Heimeranplatz 2 Mar Sendlinger Tor (2, IS), Donnersberger Brücke(3, HP), 
ü Hbf (3, HP), Laimer Platz (3, HP) 


Beispiel: Mindestanzahl von Stationen bei der Fahrt von Obersendling zum Heimeranplatz mit gespeicherten Vorgängern 
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Komplizierte Überfahrt 

a Das Vorlagenprojekt enthält eine Klasse GRAPHBAUER, welches den Graphen für die 
Flussüberquerung aus Aufgabe 11a) aus Kapitel 1.1 aufbaut. Ergänzen Sie in der Klasse 
GRAPHMATRIX eine Methode BreitensucheAusführen() so, dass der Pfad für die schnellste 
Überfahrt angezeigt wird. Nutzen Sie dabei aus, dass der Startzustand im Knoten mit der 
Nummer 0 repräsentiert ist und dass die Klasse KNOTEN eine Methode IstZielErreicht() be- 
reitstellt, die genau dann WAHR zurückgibt, wenn der Zielknoten erreicht ist. 

b Für Schnelle: Ergänzen Sie in der Klasse GRAPHCOACHES die Erzeugung des Graphen für 
die Fahrten in der Aufgabe 11b) aus Kapitel 1.1. Begründen Sie, warum die in Teilaufgabe a) 
erstellte Methode BreitensucheAusführen auch die Lösung für diese Fragestellung ermittelt. 


Wer A kauft, müsste doch auch B kaufen ... 
Onlineversandhändler speichern für Käufe 
in der Regel in einem Graphen, wie oft Ar- 
tikel zusammen eingekauft wurden. Dar- 
aus erzeugen sie für die neuen Käufe An- 
zeigen wie,Wer diesen Artikel gekauft hat, 
hat auch ... gekauft.” Für die Anzeige wird 
ausgewertet, wie oft die Artikelzusammen 
gekauft wurden, wie eng also die Kopp- 
lung der beiden Artikel ist. 

a Mit Hilfe dieses Kopplungsgraphen 
lässt sich nun eine „Kopplungsbezie- 
hung“ zwischen zwei Artikeln definie- 
ren: Zwei Artikel sind miteinander ge- 
koppelt, wenn sie überdurchschnittlich 
oft miteinander verkauft wurden; diese 
Artikel haben Kopplungsgrad 1. Redu- 
zieren Sie den gegebenen Graphen auf 
den Kopplungsgraphen, d.h. einen 
Graphen, der genau dann eine Kante 
zwischen zwei Knoten hat, wenn die 
beiden Artikel Kopplungsgrad 1 
haben. Hinweis: Der Durchschnittswert ist 235,6. 

b Zwei Artikel A und C haben Kopplungsgrad 2, wenn A mit B und B mit C gekoppelt ist, 
aber nicht A mit C. Implementieren Sie die Methode BreitensucheAusführen(startknoten: 
GANZZAHL) so, dass zu einem gegebenen Startknoten für alle anderen Knoten der Kopp- 
lungsgrad angezeigt wird. 

c Für Schnelle: Geben Sie an, wie die Methode BreitensucheAusführen leicht modifiziert wer- 
den könnte, um das gewünschte Ergebnis auch mit der ursprünglichen Adjazenzmatrix 
berechnen zu können. 

d Für ganz Schnelle: Wenden Sie das Vorgehen der Teilaufgaben a) und b) auf die Ermittlung 
der Bacon-Zahl (Aufgabe 12b) aus Kapitel 1.1) an. 
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Tauschhandel 

Eine Fernsehdokumentation berichtet über die „Challenge“ der Protagonistin, während einer 
Reise ihre Zahnbürste gegen einen anderen Gegenstand einzutauschen, den sie dann wiede- 
rum eintauschen will usw. Ihr Ziel ist es, mit mehrmaligem Tauschen zu einem Mountainbike 
zu kommen. Alle Tauschangebote, die sie erhält, findet man online auf ihrem Blog: 
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1.4 Mit Graphen Probleme lösen: Anwendungen der Breitensuche 
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Ermitteln Sie, ob die Herausforderung gemeistert werden kann, indem Sie die Informationen 
aus der dafür weniger gut geeigneten Tabelle mit Hilfe eines besser geeigneten übersichtli- 
chen Graphen modellieren. Anhand des Graphen soll es auch möglich sein, nachträglich ab- 
zulesen, wer der Reihe nach mit wem getauscht haben könnte. Neben dem Objekt, das man 
sich ertauschen möchte, muss auch der Name der Person, die den Gegenstand hergibt, in den 
Knoten stehen. 


Klasse GRAPHLISTE mit Adjazenzlisten - Version 3 
Ergänzen Sie in der Implementierung der Breitensuche über Adjazenzlisten die Erweiterungen 
zur Speicherung und Ausgabe der Wege. 


Breitensuchbaum 
Da als Ergebnis der Breitensuche jeder Knoten - mit Aus- 
nahme des Startknotens - genau einen Vorgänger zuge- 
teilt bekommt, lässt sich durch ein Baumdiagramm sehr 
schnell von einem Startknoten aus ein Überblick über 
alle Pfade erhalten, die bei der Breitensuche verfolgt wer- 
den. Das Bild rechts zeigt den Baum, der für das Beispiel 
aus dem Lehrtext bei der Suche von J aus entsteht. 

a Erstellen Sie für den rechts unten gegebenen Gra- 
phen den Baum für die Suche von A aus. 

b Ergänzen Sie in dem Vorlagenprojekt die Methode BreitensucheAusführen so, dass dabei 
auch der Breitensuchbaum erstellt wird. Die Klasse KNOTEN stellt dazu eine Methode 
NeuesBlattAnfügen(blatt: KNOTEN) zur Verfügung. Zur Visualisierung können Sie die Me- 
thode BaumAnzeigen(wurzel: KNOTEN) der Klasse GRAPHMATRIX verwenden. Zum Testen 
sind unter anderem die beiden Graphen vorhanden. 
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1.5 Den optimalen Weg bestimmen: Der Dijkstra-Algorithmus 


Lieber der & dazu müssen wir links gehen! 


(&) rechte Weg, 
der ist kürzer! 


a Erklären Sie, wie Theresa und Burkhard bei der Diskussion ihrer 
Wanderroute zum Gipfel zu ihren Meinungen kommen und wer b &B 
von beiden Recht hat. 


Als nächstes steht eine Gletschertour an. Nach Recherche haben sie 
drei Routen zu drei verschiedenen Basislagern ermittelt. Über die jeweiligen Anschlussrouten 
zum Gletscher ist ihnen allerdings noch gar nichts bekannt. Insgesamt möchten die beiden 
eine möglichst kurze Zeit gehen. 


Da wir noch nicht wissen, wie es von dort 


Warum sollten wir dann nicht für weitere Wegrecherchen ) 


® ® 
[ aus jeweils weitergeht, ist es völlig egal, für erst einmal vom aktuell günstigsten Wegpunkt ausgehen?! 
welches Basislager wir uns entscheiden. 


b Beziehen Sie Stellung zu den geäußerten Meinungen. 

c Nach erneuter Recherche haben die beiden weitere Infor- 
mationen gesammelt: Der Graph zeigt durchschnittliche 
Gehzeiten zu verschiedenen Einstiegspunkten in Kletter- 
passagen und zu verschiedenen Hochlagern. 


94 Z Suchen wir doch vom günstigsten Hochlager aus weiter! ) 


Was, wenn wir 
von dort aus einen 
Weg zum Gipfel 
finden, der die 


Untersuchung von 
zumindest einem 
anderen Hochlager 
aus überflüssig 
macht? 
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& Hat immer noch keinen Vorteil, wir müssen doch sowieso alle 
“ Varianten zum Gipfel herausfinden! 
Q 


Reflektieren Sie Ihren Standpunkt aus b) für die neue Situation. 
Geben Sie außerdem eine mögliche Wegdauer vom günstigsten Hochlager zum Gipfel 
an, die Burkhards These stützt. 


Wenige Kanten heißt nicht immer kurz 
Laura und Ivan möchten die kürzeste Weg- 
strecke zwischen zwei Orten herausfinden. 
Mit der Breitensuche funktionierte das bei 
ihren bisherigen Versuchen oft, aber nicht 
immer: Im nebenstehenden Beispiel findet 
die Breitensuche den Pfad mit vier Kanten 
Jo KON» R © 5 mit Weglänge 14 als Lö- 
sung, der kürzeste Weg ist aber der Pfad 
J>C>D->E>O> S über fünf Kanten 
mit der Weglänge 13. 

Laura und Ivan ist schnell klar, was sie ändern müssen: 


« Beim Übergang zu einem neuen Knoten muss die tatsächliche Weglänge (allgemein: das Ge- 


wicht der Kante) zur vorigen Länge addiert werden. 


1.5 Den optimalen Weg bestimmen: Der Dijkstra-Algorithmus 


« Es wird nicht einfach der erste Knoten aus der Warteliste genommen, sondern der, der den 
bisher insgesamt geringsten Abstand zum Startknoten (die geringste Weglänge) hat. 


Kürzeste Wege wählen 

Nach der Bearbeitung des Startknotens J muss die Wegesuche dementsprechend nicht mit Kno- 
ten C (Länge 3), sondern mit Knoten | (Länge 2) fortgesetzt werden (linkes Bild). 

Bei der Bearbeitung des Knotens R wird der Zielknoten S erstmals erreicht; die Gesamtweglänge 
ist 14 (rechtes Bild). Aufgrund der Vorüberlegungen muss sich aber noch ein kürzerer Weg der 
Länge 13 ergeben. 


"XY) YYYYYY 


Der kürzere Weg wird bei der Bearbeitung des KnotensO (linkes Bild) gefunden. O (Weglänge 11) 
wird erst nach R (Weglänge 10) bearbeitet; der Weg von O nach S ist aber deutlich kürzer als der 
Weg von R nach S. Schließlich wird der Knoten S ohne weitere Verbesserungen zum aktuellen 
Knoten (rechtes Bild, Anmerkung: für den Knoten W könnte jetzt die kürzere Weglänge 15 ein- 
getragen werden). 


®o® 


Der Algorithmus 

Der so modifizierte Algorithmus zur Breitensuche wird - da es keinen schnelleren Algorithmus 
gibt - in allen Apps für die Berechnungen kürzester Pfade in einem gewichteten Graphen ver- 
wendet. Er wird nach seinem Entwickler, dem niederländischen Informatiker Edsger Wybe 
Dijkstra, der Dijkstra-Algorithmus genannt. 


Der Dijkstra-Algorithmus ermittelt den kürzesten Pfad von einem Startknoten zu einem 

Zielknoten in einem gewichteten Graphen, d. h. den Pfad mit der minimalen Summe von 

Kantengewichten. 

Er modifiziert die Breitensuche, indem er: 

» die Summe der Kantengewichte bis zu jedem Knoten berechnet und 

« als nächsten zu untersuchenden Knoten denjenigen wählt, der die kleinste Summe von 
Kantengewichten hat. 


Man nimmt nun 
nicht mehr wie bei 
der allg. Breiten- 
suche den ersten 
Knoten (hier C) 
aus der Wartelis- 
te, sondern den, 
dessen Entfernung 
zum Startknoten 
am geringsten ist 


(hier: I). 


N 


Der Dijkstra-Algo- 
rithmus ermittelt 
nur dann sicher 


den kürzesten 
Weg, wenn alle 
Kantengewichte 
positiv sind, 


(®) 
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Aufgaben 


1 Informatik ist überall: Navigationsgeräte und mehr 
Außer in Navigationsgeräten wird der Dijkstra-Algorithmus auch in vielen Programmen auf 
Desktopcomputern und Mobilgeräten zur Wegesuche verwendet (Tipp: ÖPNV, Tankstellen 
etc.). Erkunden Sie mindestens drei Anwendungen und ermitteln Sie, was diese Programme 
für unterschiedliche Einsatzmöglichkeiten anbieten, insbesondere, welches Optimalitätskrite- 
rium außer dem kürzesten Weg in der Regel auch angeboten wird. 


2 Dijkstra-Algorithmus und alle Wege im Vergleich 

a Ermitteln Sie alle möglichen Wege von A nach D mit ihrer 
Länge. 

b Ermitteln Sie den kürzesten Weg von A nach D nach dem 
Dijkstra-Algorithmus. 

c Vergleichen Sie den Aufwand bei a) und b). Begründen Sie, 
weshalb der Dijkstra-Algorithmus erst bei vielen Knoten 
überlegen ist. 


3 Dijkstra-Algorithmus durchführen 
Für den Weg von München nach Venedig gibt es in- Gasserbun) 
Wasserl 


60 
bur. 
zwischen ein gut ausgebautes Fernradwegenetz. Die ns r > 


Abbildung rechts zeigt daraus einen Ausschnitt. 


Ermitteln Sienach dem Dijkstra-Algorithmus den kür- 198 92 

zesten Weg von München nach Venedig. Geben Sie Salzburg) 
den Pfad und seine Länge an. Arbeiten Sie wie bei der Ges) 
Aufgabe 2 aus Kapitel 1.4 in Partnerarbeit- nach dem " 256 


r 
Rollentausch ermitteln Sie den kürzesten Weg von : 

Treviso nach Wasserburg. (Trient) (richen) (folmezzo) 
Die Form der Tabelle aus Kapitel 1.4 können Sie ent- 
sprechend übernehmen, nur dass Sie statt der Anzahl 
der Knoten die Weglänge notieren müssen. Achten 
Sie auch darauf, ob Sie in der To-Do-Liste eine Entfer- 
nung überprüfen müssen (siehe unten); im Beispiel 
sind Salzburg und Tolmezzo beim Erreichen auf ei- 
nem zweiten Weg überprüft worden. 


| Schritt [ort | Länge | vorg. 
f) = 


Wasserburg 


To-Do-Liste 


München (60, WB), Rosenheim (28, WB) 


München (60, WB), Brenner (190, RO), Kitzbühel (98, RO), 
Salzburg (120, RO) 


Rosenheim 


München Brenner (190, RO), Kitzbühel (98, RO), Salzburg (120, RO) 
Brenner (190, RO), Salzburg (120, RO), Innichen (233, KB), 


ie Tolmezzo (271, KB) 


Salzburg Brenner (190, RO), Innichen (233, KB), Tolmezzo (271, KB) 


4 Passende Halskette (nach Informatik-Biber 2013) 


6 Von München nach Hamburg & © 


1.5 Den optimalen Weg bestimmen: Der Dijkstra-Algorithmus SS 


DA 5 


Welchen Umfang 
darf mein Hals 
höchstens haben, 


Kim hat sich aus bunten Perlen 
eine Halskette geknüpft. Die Zah- 
len geben in Zentimetern die Län- 
ge der Schnüre zwischen den Per- 


damit die Kette 


len an. Links und rechts sieht man noch herum 
die Verschlüsse. passt? 
Beschreiben Sie, wie sich Kims 

Problem auf ein bekanntes berechenbares Problem übertragen lässt, und ermitteln Sie algo- 

rithmisch die Antwort auf Kims Frage. 


Ganz schön viele Wege! n=1 n=2 n=3 9 
a Bestimmen Sie die Anzahl der We- ] [ ] I [ ] | | i Q er 
für die drei Graphen. Jede Kante 
darf nur einmal durchlaufen werden. 
ohne die Grundebene). 
c Prozessoren sind etwa im Nanosekundentakt getaktet. Schätzen Sie ab, bei wie vielen 
Nanosekunden (4,4 - 102°), wenn jeder Weg in nur einer Nanosekunde bestimmt werden 
könnte. 


ge vom roten zum grünen Knoten 
b Geben Sie eine Formel an für die Anzahl der Wege abhängig von n (Anzahl der Ebenen 
Knoten die Berechnung aller Wege länger dauern würde als das Alter des Universums in 
d Beschreiben Sie, weshalb der Dijkstra-Algorithmus hier sehr viel schneller arbeiten würde. 


a Ermitteln Sie den kürzesten Weg von München 
nach Hamburg mit dem Dijkstra-Algorithmus. 

b Erklären Sie begründet, wann die Suche nach dem 
kürzesten Weg beendet werden kann. 
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Dijkstra-Algorithmus erläutern 


Das unten stehende Struktogramm fasst den vollständigen Dijkstra-Algorithmus zusammen. 


Farbig hinterlegt sind die im Vergleich zur Breitensuche neuen Elemente. 


warteliste.Leeren() 

fertigeKnoten.Leeren() 
knoten.ElementGeben(startKnoten).vorgänger = -1 
knoten.ElementGeben(startKnoten).länge =0 
aktuellerKnoten = startKnoten 


wiederhole solange nicht aktuellerKnoten == zielKnoten 


zähle nummer von 0 bis anzahlKnoten - 1 


längeNeu =matrix.ElementGeben(aktuellerKnoten).ElementGeben(nummer) 


warteliste.Anfügen(nummer) 

knoten.ElementGeben 
(nummer).vorgänger = 
aktuellerKnoten 

knoten.ElementGeben 
(nummer).länge = 
knoten.ElementGeben 
(aktuellerKnoten).länge + 


fertigeKnoten.Anfügen(aktuellerKnoten) 


ED Te 


AusgabeZeile("Der Weg hat die Länge ', knoten.ElementGeben(aktuellerKnoten).länge) 


wiederhole solange aktuellerKnoten >=0 


Ausgabe(knoten.ElementGeben(aktuellerKnoten).name, "") 
aktuellerKnoten = knoten.ElementGeben(aktuellerKnoten).vorgänger 


a Die gelb hinterlegten Teile holen und verwenden den Gewichtswert der Adjazenzmatrix. 
Geben Sie an, welcher Wert hier bei der Breitensuche impliziert wurde und warum die Va- 
riable längeNeu in der Breitensuche nicht verwendet wurde. 

b Die beiden orange hinterlegten Bedingungen waren in der Breitensuche zu einer Bedin- 
gung zusammengefasst. Begründen Sie kurz, welche neu hinzugekommene Möglichkeit 
diese Aufteilung nötig macht. 

c Geben Sie an, welche Aufgabe der rot hinterlegte Algorithmusteil erledigt, und erläutern 
Sie die Bedeutung jeder Codezeile. 

d Der grün hinterlegte Teil des Algorithmus bestimmt den neuen aktuellen Knoten. Erläu- 
tern Sie die Vorgehensweise. 


1.5 Den optimalen Weg bestimmen: Der Dijkstra-Algorithmus 


*8 Für Schnelle: Dijkstra-Algorithmus implementieren 


Ergänzen Sie in dem gegebenen Projekt die Methode BreitensucheAusführen zum vollstän- 

digen Dijkstra-Algorithmus und benennen Sie die Methode entsprechend um. Die Teilaufga- 

ben geben dabei die notwendigen Schritte an. Nutzen Sie auch das in Aufgabe 7 angegebe- 
ne Struktogramm. 

a Ergänzen Sie in der Zählwiederholung das Attribut längeNeu und setzen Sie es auf den 
korrekten Wert (gelbe Hinterlegung). 

b Erweitern Sie die Bedingung der bedingten Anweisung und fügen Sie die zweite be- 
dingte Anweisung ein (orange Hinterlegung). 

c Ergänzen Sie den wahr-Teil der zweiten bedingten Anweisung, in dem überprüft wird, 
ob der Knoten mit dem aktuellen Knoten auf einem kürzeren Weg erreicht werden kann 
und in dem dann der neue Vorgänger und die neue Länge gesetzt werden (rote Hinter- 
legung). 

d Der neue aktuelle Knoten ist nun nicht mehr einfach der erste Knoten der To-Do-Liste, 
sondern der Knoten, der bisher auf dem kürzesten Weg erreicht werden kann. Ergänzen 
Sie auch diesen Teil (grüne Hinterlegung). 

e Testen Sie den Algorithmus mit dem gegebenen Beispiel aus Aufgabe 2. 

f Für Schnelle: Erstellen Sie den Graphen für Aufgabe 3 als Datenbank und testen Sie da- 
mit wieder. 


*9 Schnelle Flussüberquerung 


Inder Aufgabe 11c) aus Kapitel 1.1 müssen vier Studenten einen Fluss überqueren. Ergänzen 
Sie das gegebene Projekt, so dass mit Hilfe des Dijksta-Algorithmus sowohl die Schritte zur 
kürzesten Flussüberquerung als auch die kürzeste Überquerungszeit ermittelt werden. 


*10 Klasse GRAPHLISTE mit Adjazenzlisten - Version 4 


a Implementieren Sie den Dijkstra-Algorithmus auch für die Darstellung des Graphen über 
Adjazenzlisten. 

b Für ganz Schnelle: Der Graph kann auch nach der Grundmodellierung aus Kapitel 1.1 
(je ein Feld mit Referenzen auf Objekte der Klassen KNOTEN bzw. KANTE) implementiert 
werden. 
Führen Sie diese Implementierung durch. Bewerten Sie anschließend die drei Imple- 
mentierungsvarianten bezüglich Speicherbedarf, vermuteter Programmlaufzeit und Ein- 
fachheit/Übersichtlichkeit der Umsetzung im Programm. 
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as Teste dich selbst! Zusammenfassung zes 
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Teste dich selbst 


T1 


T2 


T3 


Richtig oder falsch? 

Beurteilen Sie, ob folgende Aussagen richtig oder falsch sind. Begründen Sie Ihre Meinung 

bei falschen Aussagen und geben Sie eine berichtigte Aussage an: 

a Ein Graph wird durch Kanten und Knoten vollständig beschrieben. 

b Ein gerichteter Graph kann nicht gewichtet sein. 

c Mit der Breitensuche kann nach einem erreichbaren Knoten mit bestimmten 
Eigenschaften gesucht werden. 

d Die Breitensuche ermittelt den kürzesten Weg zu einem gegebenen Knoten. 

e Bei der Breitensuche wird immer in Richtung zum Zielknoten gearbeitet. 

f Der Dijkstra-Algorithmus basiert auf der Breitensuche. 

g Der Dijkstra-Algorithmus ist nur für gewichtete Graphen verwendbar. 


Eine gute Erklärung ist alles! 

Jan war in der letzten Stunde krank und braucht daher eine gute Erklärung, was genau sich 

beim Dijkstra-Algorithmus gegenüber der Breitensuche geändert hat. Erläutern Sie ihm 

detailliert, 

« warum die Breitensuche nicht notwendigerweise den kürzesten Weg in einem 
gewichteten Graphen findet, 

» an welcher Stelle im Algorithmus berücksichtigt werden muss, dass das Kantengewicht 
anstelle der Anzahl der Kanten verwendet wird, und 

« wie der nächste Knoten aus der To-Do-Liste ausgewählt wird. 


Programmieren 

Gegeben ist der rechts stehende Graph. 

a Erstellen Sie eine Klasse, in der der Graph mit Hilfe einer als 
zweidimensionales Feld realisierten Adjazenzmatrix gespeichert 
wird. 

b Ergänzen Sie eine Methode BreitensucheDurchführen(start, ziel), 
die einen Weg vom Start- zum Zielknoten findet und ausgibt, wie 
viele Kanten benutzt werden. 

c Ergänzen Sie die Methode BreitensucheDurchführen so, dass der gefundene Weg als 
Knotenfolge ausgegeben wird. 

d Ändern Sie den Graphen so ab, dass er nicht mehr zusammenhängend ist. Sie können 
dazu Knoten ergänzen und/oder Kanten entfernen. Ändern Sie Ihre Methode 
BreitensucheDurchführen so ab, dass im Fall eines vom Startknoten aus nicht 
erreichbaren Zielknotens eine entsprechende Meldung statt des Wegs ausgegeben 
wird. 


Zusammenfassung 


Graphen und Bezeichnungen 


Ein Graph besteht aus einer endlichen 
Menge von Knoten und einer endlichen 
Menge von Kanten; eine Kante ist eine 
Verbindung zwischen zwei Knoten. 
Graphen können als Diagramme mit 
Knoten als Kreisen und Kanten als Ver- 
bindungslinien dargestellt werden. 


Bei gewichteten Graphen wird jeder 
Kante ein Wert zugeordnet, das 
Gewicht. Bei zusammenhängenden 
Graphen gibt es von jedem Knoten 
einen Pfad zu jedem anderen Knoten. 
Gibt es mindestens einen Knoten, von 
dem aus ein Pfad wieder zu ihm zurück- 
führt, heißt der Graph zyklisch. 

Bei gerichteten Graphen hat jede Kan- 
te eine Richtungsangabe. 


Die Adjazenzmatrix 


Eine Adjazenzmatrix ist eine spezielle 
Tabelle, deren Zeilen- und Spaltenindi- 
zes jeweils durch die Knoten und deren 
Reihenfolge festgelegt sind. In den Zel- 
len der Tabelle werden die Kanten 
vermerkt. 

Verbindet eine Kante zwei Knoten, so 
wird in derzugehörigen Zelle bei unge- 
wichteten Graphen eine 1 eingetragen 
und bei gewichteten Graphen die Ge- 
wichtung der Kante. 


ungewichteter Graph 


gewichteter Graph 


a e gerichteter Graph 


nicht zusammenhängender, 
zyklenfreier Graph 


Zyklus 


Bologna 


Innsbruck 

München 170 
Nürnberg 170 

145 


Tabellarische Darstellung der Entfernungen 


145 


Eine Adjazenzmatrix kann durch ein 
zweidimensionales Feld implementiert 
werden. 


Index 


mü: KNOTEN 


(  sa:KNOTEN \ KNOTEN 
name = "Salzburg" 


Weglänge von Salzburg nach München: 
matrix.ElementGeben(4).ElementGeben(2) hat den Wert 145 
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Breitensuche 


Die Breitensuche besucht von 
einem Startknoten aus systema- 
tisch in konzentrischen Berei- 
chen um den Startknoten alle 
(erreichbaren) Knoten eines 
Graphen. 

Mit der Breitensuche kann ein 
bestimmter Knoten gesucht wer- 
den; dieser Knoten wird auf dem 
Weg mit der geringsten Kanten- 
anzahl gefunden. Es kann auch 
geprüft werden, ob ein Graph 
zusammenhängend ist. 


Mit einer erweiterten Breiten- 
suche kann man sowohl die 
Länge des Pfads (als Anzahl der 
auf dem Weg durchlaufenen 
Kanten) von einem Startknoten 
zu einem Knoten mit einer ge- 
wünschten Eigenschaft ange- 
ben, als auch die Folge der Kno- 
ten auf diesem Pfad. 


Dijkstra-Algorithmus 


Der Dijkstra-Algorithmus er- 
mittelt den kürzesten Pfad von 
einem Startknoten zu einem 
Zielknoten in einem gewichte- 
ten Graphen, d. h. den Pfad mit 
der minimalen Summe von 
Kantengewichten. 

Er modifiziert die Breitensuche, 
indem er die Summe der Kan- 
tengewichte bis zu jedem Kno- 
ten berechnet und als nächsten 
zu untersuchenden denjenigen 
wählt, der die kleinste Summe 
der Kantengewichte hat. 


warteliste.Leeren() 

fertigeKnoten.Leeren() 
knoten.ElementGeben(startKnoten).vorgänger = -1 
knoten.ElementGebenfstartKnoten).länge =0 
aktuellerKnoten = startKnoten 


wiederhole solange nicht aktuellerKnoten == zielKnoten 


zähle nummer von 0 bis anzahlKnoten - 1 


(matrix.ElementGeben(aktuellerKnoten).ElementGeben(nummer) > 0) und, 
(nicht fertigeKnoten.Enthält(nummer)) und 
(nicht warteliste.Enthält(nummer) 
wahr 


warteliste.Anfügen(nummer) 

knoten.ElementGeben(nummer).vorgänger = aktuellerKnoten 

knoten.ElementGeben(nummer).länge = 
knoten.ElementGeben(aktuellerKnoten).länge + 1 


fertigeKnoten.Anfügen(aktuellerKnoten) 
aktuellerKnoten = warteliste.ElementGeben(0) 
warteliste.Entfernen(0) 


AusgabeZeile("Der Weg führt über‘, knoten.ElementGeben(aktuellerKnoten).länge, "Kanten") 


wiederhole solange aktuellerKnoten > 0 


‚Ausgabe(knoten.ElementGeben(aktuellerKnoten).name, " ") 
aktuellerKnoten = knoten.ElementGeben(aktuellerKnoten).vorgänger 


Zum Weiterlesen 


L1 Navigationssysteme 

Als >Navigation bezeichnet man das Bestim- 

men der geografischen Position und das Halten 

des Kurses. Das Angebot an Navigationssyste- 

men ist riesig und reicht von der Schiffs- oder 

Flugzeugnavigation bis hin zum Einsatz beim 

Autofahren, Radfahren oder Zufußgehen. Bei 

allen Systemen kann die Navigation in drei Teil- 

schritte unterteilt werden: 

« Berechnung einer Route zwischen Start und 
Ziel, 

« Bestimmung der aktuellen Position, 

- Führung des Fahrzeugs oder der Person zum Ziel. 


Routenplanung 

Um den Weg von einem Startpunkt zu einem Ziel- 
punkt zu finden, muss zunächst das gesamte Netzin 
ein geeignetes Modell übertragen werden, zum Bei- 
spiel in einen gewichteten Graphen mit Straßenstü- 
cken (Kanten) und Kreuzungen (Knoten). Der Graph 
des deutschen Verkehrsnetzes umfasst circa 5 Mil- 
lionen Kreuzungen und 6 Millionen Straßen. 

Als Gewichtung der Kanten kommen durchschnitt- 
liche Fahrzeit bzw. Entfernung infrage und für jede 
Kante werden unter anderem Straßenart, Name der 
Straße und Fahrspurenanzahl vermerkt. Die Knoten 
bekommen Zusatzinformationen: Ortsname, geo- 
grafische Koordinaten, Art der Kreuzung, ... 

Nach der Eingabe von Start und Ziel (jeweils Straße, 
Hausnummer, Ortschaft) wird in einer Datenbank 
nach dem passenden Start- und Zielknoten gesucht. 
Bei der Suche nach dem Weg werden verschiedene 
Algorithmen verwendet, wie etwa der Dijkstra-Algo- 


Ihre Route: 579,26 km 


D Rosenheimer Straße 147 


81671 München 


ED Mecklenburgische Straße 53 579,26 km 
14197 Berlin 05:51h 
Beschreibung 


ED» sie starten in der Rosenheimer Straße 


r 


u 


in München und fahren 80 m in Rich- 
tung Anzinger Straße. 


Verlassen Sie die Rosenheimer Straße 

und biegen scharf rechts in die 1 min 
Anzinger Straße ein. FolgenSiedem 554m 
Straßenverlauf 474 m. 


Verlassen Sie die Anzinger Straße 

und fahren weiter geradeaus auf die 
Anzinger Straße, Bad-Schachener- 
Straße. Folgen Sie dem Straßenverlauf 
für 18 m. 


Verlassen Sie die Anzinger Straße, Bad- 
Schachener-Straße und biegen links in 
die Aschheimer Straße, Melusinenstraße ... 


rithmus. Eine Abwandlung davon ist der A*-Algorithmus, der die Anzahl der untersuchten Knoten 
mithilfe >heuristischer Überlegungen möglichst klein hält. Bei sehr großen Graphen wird der 
Dijkstra-Algorithmus weiter optimiert, indem das Netz hierarchisch eingeteilt wird. So werden 
z.B.bei Straßennetzen erst Autobahnen, dann Bundesstraßen und dann Landstraßen betrachtet. 
Das Ergebnis einer Routenplanung ist eine textuelle Beschreibung des Fahrweges (siehe Abbil- 


dung). 


a Zusammenfassung Zum Weiterlesen as 


> lat. navigare: 
segeln 


> gr. EÜPIOKEIV 
heuriskein: 
auffinden, 
entdecken; 
Lösungsstrategie 
auf der Basis 
unvollständiger 
Information mit 
logisch 
begründeteten 
Annahmen 
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1 Vernetzte Strukturen - Graphen 


Digitalisierte Karten 

Für die Berechnung einer Route spielt die geome- 
trische Anordnung der Kanten und Knoten eines 
Graphen keine Rolle. Die Benutzer einer Routenpla- 
nungssoftware möchten jedoch ihreRoute aufeiner 
Landkarte dargestellt sehen. Hierzu muss die Land- 
karte in digitalisierter Form vorliegen: Die Straßen 
und Kreuzungen müssen mit Ortskoordinaten 
versehen sein. Um die Umgebung möglichst wie- 
dererkennbar anzuzeigen, muss zusätzlich die Nut- 
zungsart der Flächen zwischen den Straßen erfasst 
sein (geografisches Informationssystem, Kurzform 
GIS). 


Lokalisation 

Die aktuelle Position eines Objektes kann auf vielfäl- 
tige Weise ermittelt werden. Neben historischen 
Instrumenten wie dem Sextanten sind heute vor 
allem funk- und satellitengestützte Systeme im 
Einsatz. Das GPS (Global Positioning System) basiert 
auf 24 Satelliten, die die Erde umkreisen und dabei 
ständig ihre Position und ihre Uhrzeit senden. Der 
GPS-Empfänger empfängt diese Daten und berech- 
net aus den Positionsangaben und Signallaufzeiten 
von mindestens vier Satelliten seine eigene geogra- 
fische Position. Die aktuelle Position des Objekts 
kann auf der Basis dieser geografischen Koordina- 
ten in das digitale Kartenmaterial eingetragen wer- 
den. 


Führung zum Ziel 

Mittels der aktuellen Position und des digitalen Wissens über den Straßenverlauf kann das 
Navigationssystem jederzeit Auskunft über den weiteren Verlauf der Fahrt geben. Diese Informa- 
tion wird grafisch in einem Display angezeigt und oft von einer Stimme akustisch unterstützt. 
Um für optimale Verständlichkeit und wenig Ablenkung zu sorgen, ist diese Stimme möglichst 
angenehm gehalten. 


2 Codierung 


In diesem Kapitel erfahren Sie, wie ... 


.„. Information digital gespeichert und 
übertragen wird. 


... Information zum Schutz vor unbefugtem 
Zugriff verschlüsselt werden kann. 


... sichergestellt werden kann, dass hinter 
digitalen Produkten auch tatsächlich der 
angegebene Urheber steckt. 


(6) 


Wird schon passen, stand ja 
so in der E-Mail...! 


Medium: von lat. 
medium, Mitte, 
dazwischenliegend 


>von lat. codex, 
Schreibtafel, 
(Regel-)Buch 
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2 Codierung 


2.1 Informationen geeignet darstellen: Codierung 


Informationen lassen sich in vielen verschiedenen Formen speichern und übertragen. 

a nebierhcseB eiS enie eniemeglla legeR, eiw reseid txeT ni enie lamron erabsel mroF 
tztesrebü nedrew nnak. 

b DDDiiissskkkuuutttiiieeerrreeennn SSSiiieee VVVooorrr--- uuunnnddd 
NNNaaaccchhhttteeeiiillleee dddiiieeessseeerrr DDDaaarrrsssttteeelllllluuunnngggsss- 
fffooorrrmmm eeeilinnneeesss TT Teeexxxttteeesss... 

c Die Abbildung links zeigt die Rückseite eines Milchkartons. Beschreiben Sie, auf wel- 
chen Wegen die Information „Dies ist Biomilch der Firma Biogut Infohausen“ dargestellt 
ist und geben Sie Stärken und Schwächen der jeweiligen Darstellungsweise an. 


Informationen mittels Codierung speichern und übertragen 


Die oben gezeigte Grafik illustriert, wie ein und dieselbe Information auf drei verschiedene Arten 
übermittelt werden kann: In deutscher gesprochener Sprache, in Schrift- und Bildform und in 
Form einer bekannten Melodie. Der Begriff Information“ beschreibt also lediglich ein abstraktes 
Konzept. Soll eine Information an Andere weitergegeben oder für den späteren Abruf gespei- 
chert werden, so muss zunächst eine physische Repräsentation der Information geschaffen wer- 
den. Für die Erzeugung einer solchen Repräsentation stehen verschiedene >Medien zur Verfü- 
gung, etwa Tinte und Papier, Farben und Leinwand oder auch die Luft zum Transport der 
Schallwellen der eigenen Stimme. Ohne ein solches Medium kann keine Informationsübertra- 
gung oder -speicherung stattfinden. 


Damit die Kommunikationspartner die gegenseitigen Botschaften auch verstehen können, istes 
nötig, dass beide die genutzte Sprache sprechen, beide die verwendete Schrift oder Symbolik 
kennen oder beide einer Melodie die gleiche Bedeutung zuordnen. Die zu übertragenden Infor- 
mationen müssen gemäß beidseitig bekannter Regeln dargestellt/repräsentiert werden (ein auf 
Chinesisch verfasster Liebesbrief wäre für eine ausschließlich deutschsprachige Empfängerin 
beispielsweise unverständlich). Eine Übersetzung gemäß solcher Regeln bezeichnet man als 
>Codieren. 


Bestimmte Regeln für die Informationsdarstellung gelten auch bei der Informationsverarbeitung 
mit einem Computer. Nicht jede Darstellungsform einer Information kann unmittelbar von einem 
Computer verarbeitet werden. Die Übersetzung einer Information in eine Form, die der Compu- 
ter versteht, muss exakt festgelegten Regeln folgen. Information in einer Form, die der Computer 
verarbeiten kann, werden als Daten bezeichnet. 


2.1 Informationen geeignet darstellen: Codierung 


Eine kompakte Codierung birgt Vor- und Nachteile 

Bereits Teilaufgabe b) der Einstiegsaufgabe zeigt, dass durch entsprechende Codierungsregeln 
auch unnötig umfangreiche Informationsdarstellungen entstehen können. Der gleiche Informa- 
tionsgehalt ist hier ohne die Buchstabenwiederholungen mit insgesamt wesentlich weniger 
Zeichen darstellbar. In der normalen deutschen Schriftsprache lassen sich ebenfalls unterschied- 
lich kompakte Codierungen realisieren. Eine taggenaue Datumsangabe kann z. B. wie folgt co- 
diert werden: 

a Dreiundzwanzigster September im Jahr zweitausendsiebenundzwanzig 

b 23.09.2027 


Beide Darstellungen repräsentieren genau die gleiche Information, Darstellung a) benötigt dafür 
jedoch wesentlich mehr Zeichen als Darstellung b). In Fällen, in denen Speicherplatz oder Über- 
tragungskapazitäten knapp sind, wird oft versucht, durch eine geschickte Codierung Informati- 
onen möglichst kompakt zu codieren. In Situationen, bei denen Speicher- oder Übertragungs- 
fehler nicht ausgeschlossen werden können, kann dies jedoch auch von Nachteil sein: Überträgt 
man beispielsweise die oben genannten Datumsdarstellungen über ein Medium, bei dem es zu 
Signalstörungen kommt, könnte die auf Empfängerseite erhaltene Darstellung wie folgt 
aussehen: 

a Dreicndzwaneigster Septa3ber im Jahr zoeitausendsiebehjudzwanzig 

b 23.09.2023 


Während bei Darstellung b) bereits ein einziges falsch übertragenes Zeichen genügt, um die 
Datumsangabe unbemerkbar zu verfälschen, ist bei Darstellung a) sogar trotz vieler Übertra- 
gungsfehler für einen der deutschen Schriftsprache mächtigen Menschen noch eindeutig fest- 
stellbar, welches Datum gemeint ist. Codierung a) ist zwar umfangreicher, aber dafür fehlertole- 
ranter als Codierung b). 


Prüfsummen decken Übertragungsfehler auf 

Um zu verhindern, dass Fehler bei der Datenübertragung oder -speicherung unerkannt bleiben, 
können sogenannte Prüfsummen erzeugt und zu den eigentlichen Nutzdaten hinzugefügt wer- 
den. Soll beispielsweise ein Rechnungsbetrag übermittelt werden, kann neben dem Betrag zu- 
sätzlich die Summe aller Ziffern übertragen werden. Auf der Empfängerseite kann nun die Zif- 
fernsumme des empfangenen Betrages mit der ebenfalls erhaltenen Prüfsumme verglichen 
werden. Damit können unerkannte Fehler zwar nicht ganz ausgeschlossen werden und auch 
absichtliche Manipulationen sind problemlos möglich; viele einfache Übertragungsfehler fallen 
beim Vergleich der Prüfsummen aber sofort auf, sodass z. B. eine Neuübertragung der Daten 
angefordert werden kann. 


Information kann nicht direkt gespeichert oder übertragen werden, sondern muss mit Hil- 
fe eines Mediums (Papier, Luft, ...) dargestellt werden. Information ist der (abstrakte) Be- 
deutungsgehalt dieser Darstellung. Die Übertragung in eine Darstellungsform nach genau 
festgelegten Regeln nennt man Codieren. Wenn Information so dargestellt ist, dass ein 
Computer sie verarbeiten kann, spricht man auch von Daten. 

Zentrale Ziele einer Codierung sind u. a., Informationen möglichst kompakt und fehlertole- 
rant (z. B. mit Hilfe von Prüfsummen) zu speichern oder zu übertragen. 


a 
22081 
3AF 


2+3+4+2 ist 
nicht 17! Hier 


kann etwas nicht 
stimmen! 
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wrr 


203 
o1ı 
AF 


808 
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2 Codierung 


Aufgaben 


1 Richtig oder falsch? 


Entscheiden Sie: sind die Aussagen richtig oder falsch? Berichtigen Sie falsche Aussagen. 
a Information kann direkt gespeichert und übertragen werden. 

b Codieren ist das Schreiben von Computerprogrammen. 

c Eine kompakte Codierung kann auch Nachteile haben. 


Komplexe Texte über ein primitives Medium übertragen: Der Morsecode 

Eines der ersten Verfahren zur ‚elektronischen Kommunikation“ war die Telegraphie. Die dabei 
verwendete Schaltung kann vereinfacht wie folgt beschrieben werden: 

Der Sender konnte auf der Empfängerseite somit nur zwei unterschiedliche Zustände, „Lampe 
an” und,Lampe aus“, erzeugen. 


Sender Empfänger 


Taster 


au ' 
— Batterie 


Um trotz dieser Einschränkungen des Mediums komplexe Informationen übertragen zu kön- 

nen, kann der nach Samuel Morse benannte Morsecode verwendet werden. Die Buchstaben 

eines Textes werden dabei durch eine Abfolge kurzer (-) und langer (-) Signalimpulse mit da- 
zwischenliegenden Pausen repräsentiert. Eine Tabelle des Morsecodes ist als Vorlage verfüg- 
bar. Im Internet sind ebenfalls Morsecode-Tabellen zu finden. 

a Schreiben Sie die Nachricht der Figur oben links in normaler Buchstabendarstellung. 

b Formulieren Sie eine begründete Vermutung über die Hintergründe der Zuordnung von 
Buchstaben zu Signalimpulsen und beurteilen Sie, wie sich die Zuordnung auf die durch- 
schnittlich benötigte Übertragungszeit bei morsecodierten Texten auswirkt. 

c Morsecode durch elektrische Signale zu übertragen erscheint zunächst einfach. Eine 
Codierungsvorschrift könnte z. B. lauten: 

Langer Signalimpuls (-) -> Lampe an 

Kurzer Signalimpuls (-) -> Lampe aus 

Versuchen Sie mit dieser Codierungsvorschrift die durch die Sequenz 

„aus an an aus an aus aus an“ repräsentierte Zeichenkette eindeutig zu ermitteln und be- 
schreiben Sie das hierbei auftretende Problem und dessen Ursache. 

d Für Schnelle: Entwerfen Sie eine alternative Codierungsvorschrift für die Darstellung elek- 
trisch übertragener Morsecodes, die das Problem aus Teilaufgabe c) vermeidet. 


Music-XML 

Eine mögliche Codierung von Melodien bzw. Noten allgemein ist Music-XML. 

a Öffnen Sie die Vorlage in einem Texteditor und in einem Browser. 
i Beschreiben Sie knapp Unterschiede und Gemeinsamkeiten. 
ii Nennen Sie enthaltene Informationen, die über die Melodie hinaus gehen. 
iii Geben Sie den Titel des Liedes und die erste Note der Melodie an. 


2.1 Informationen geeignet darstellen: Codierung 


b Recherchieren Sie ein Programm, das Music-XML Dateien darstellen und eventuell ab- 
spielen kann. Öffnen Sie damit die Datei und überprüfen Sie Ihre Antwort aus a). 
c Codieren Sie die Melodie auf weitere zwei Arten. 


Barcodes und QR-Codes 

Barcodes und QR-Codes sind mittlerweile allgegenwärtig. 

a Erstellen Sie in Kleingruppen je eine Liste mit Situationen, bei denen Ihnen bereits Bar- 
codes und QR-Codes begegnet sind. 

b Beschreiben Sie allgemein, welchem Zweck die Verwendung dieser Codierungsformen in 
der Regel dient. 

c Betrachten Sie einen Barcode (z. B. auf der Rückseite dieses Buches) und versuchen Sie 
ohne Zuhilfenahme des Internets zu beschreiben, auf welche Weise die Information bei 
einem Barcode repräsentiert wird. 

d Recherchieren Sie für QR-Codes sowie für die in Europa weit verbreiteten EAN-13 Bar- 
codes, wie viel Information (angegeben in einer Einheit Ihrer Wahl) diese maximal enthal- 
ten können. 

e Diskutieren Sie die Vor- und Nachteile von Barcodes im Vergleich mit QR-Codes und for- 
mulieren Sie für die Einsatzgebiete aus a) je eine Vermutung, weshalb sich dort das eine 
oder andere Format durchgesetzt hat. 


Zauberhafte Prüfsummen 

Zauberer Zampano lässt seine Zuschauer 

auf einem rechteckigen Feld im blauen Be- 

reich Karten mit Kaninchen und Spatzen 

auslegen. Im grünen Bereich legt er selbst 

anschließend weitere Karten hinzu. Danach 

verlässt er den Raum und die Zuschauer 

drehen eine beliebige Karte um, die Zam- 

pano erkennen muss. 

a Finden Sie die Karte, die von den Zu- 
schauern umgedreht wurde. 

b Beschreiben Sie die Idee des Zaubertricks. 


Prüfsummen im Alltag: IBAN 

a Bei Überweisungen innerhalb der EU werden Bankkonten mittels der IBAN (International 
Bank Account Number) identifiziert. Da Tippfehler hier gravierende Folgen haben könnten, 
enthält jede IBAN an Position 3 und 4 (direkt nach der zweistelligen Länderkennung) eine 
zweistellige Prüfsumme. Recherchieren Sie das Verfahren, mittels dem die IBAN-Prüfsum- 
men gebildet werden, und erläutern Sie Schritt für Schritt, wie die Gültigkeit der IBAN 
DE42 8327 3829 0032 8800 00 überprüft werden kann. 

b Notieren Sie eine gültige IBAN (z. B. eines öffentlichen Spendenkontos). Versuchen Sie an- 
schließend durch gezielte „Tippfehler“ eine davon abweichende IBAN zu erzeugen, wel- 
che die gleiche gültige Prüfsumme besitzt. 

Hinweis: Durchlaufen Sie das Berechnungsverfahren aus Teilaufgabe a) schrittweise rück- 
wärts, um herauszufinden, wie die IBAN verändert werden kann, ohne dass sich die Prüf- 
ziffer dadurch ändert. 

c Beschreiben Sie basierend auf b) allgemein, welche Arten von Verfälschungen durch das 
verwendete Prüfsummenverfahren nicht erkannt werden können. Beurteilen Sie, wie 
wahrscheinlich derartige nicht erkennbare Fehler im Alltag sind. 

d Für Schnelle: Implementieren Sie ein kleines Programm, mittels welchem die Gültigkeit 
der Prüfsumme für beliebige IBANs überprüft werden kann. 
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1023 
100 : 
3a r 2 Codierung 


> Bit: Kunstwort 
(„Kofferwort“) aus 
binary und digit, also 
Binärstelle 


Auch Bilder und 
Farben müssen durch 
Zahlen ausgedrückt 
werden, Mehr dazu 
finden Sie in den 


Aufgaben! 
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2.2 Was der Computer versteht: Bits, Bytes & Zahlensysteme 


Bei einer Show des Wahlkurses Zaubertricks sollen 
Zahlen per „Gedankenübertragung“ übermittelt wer- 
den. In Wirklichkeit aber verraten kleine Strahler in der 

Bühnenbeleuchtung dem „Zauberer“ die jeweiligen 

Werte. Das System ist in der Vorlage dargestellt: Durch 

Klicken auf die einzelnen Leuchten kann man sie an- 

bzw. ausschalten. Die dadurch heimlich übermittelte 

Zahl wird darunter angezeigt. 

a Finden Sie heraus, nach welchem System die Zahlen dargestellt werden und wie viele 
Werte mit den vier Leuchten insgesamt beschrieben werden können. 

b Folgern Sie, wie die Zahlen 32 und 47 nach diesem System dargestellt werden müssten, 
und geben Sie beide Darstellungen an. (Hinweis: Der Zahlenbereich wird erweitert.) 

c Für Schnelle: Die Leuchtmittel werden durch LEDs ausgetauscht, die neben gelb auch 
noch in rot leuchten können. Erschließen Sie sich das veränderte System und geben Sie 
eine Darstellung der Zahlen 17 und 64 an. Wie viele Werte könnte man mit den vier vor- 
handenen Leuchten nun insgesamt darstellen? 


Information für den Computer aufbereiten 

Sämtliche Information, die ein Computer verarbeiten (also speichern, darstellen, übertragen, ...) 
soll, muss auf eine spezielle Weise codiert werden. Dies ist durch den grundsätzlichen Aufbau 
von Computern bedingt: Intern arbeitet ein Computer mit Speicherzellen. An einer elektroni- 
schen Speicherzelle kann entweder Spannung anliegen oder nicht; nur diese beiden Zustände, 
notiert als,1” und „O“, sind möglich. Diese kleinste Informationseinheit bei der digitalen Daten- 
verarbeitung wird >Bit genannt. Information, die vom Computer gespeichert werden soll, muss 
also letztlich als Bitfolge (darstellbar als Abfolge von Nullen und Einsen) codiert werden. 


Bitfolge codiert durch Spannung EIR/RIER in elek- SEE 
tronischen Speicherzellen (Speichermedium) 


Auch für die Übertragung einer solchen Codierung werden üblicherweise nur zwei Zustände 
genutzt, z.B. wechselnde hohe undnniedrige Spannung in einem Kupferkabel. Um die Codierung 
einer Information als Bitfolge möglichst systematisch und nachvollziehbar festzulegen, wird jede 
Information nach festgelegten Regeln als Zahl ausgedrückt. Beispielsweise werden allen Zeichen 
gemäß einer Tabelle fortlaufende Zahlen eindeutig zugeordnet. Der Clou: Die Zahlen werden in 
einem Zahlensystem codiert, das nur mit Nullen und Einsen auskommt: Das Binärsystem. 


Aus den empfangenen Bitfolgen 
berechne ich die Darstellungen 
auf dem Monitor. 


1. 


u 


—— Bitfolge codiert durch — 
wechselnde elektrische Spannung im 
Kupferkabel (Übertragungsmedium) 


„H“ und „I” übersetze ich 
gleich bei der Eingabe in die 
Bitfolgen der zugeordneten 
Binärzahlen. So kann ich sie 
speichern und übertragen. 


1000111 


1001001 yY\ 


Zuordnungs- 
tabelle 


2.2 Was der Computer versteht: Bits, Bytes & Zahlensysteme 


Dezimalsystem vs. Binärsystem 
Wir nutzen im Alltag üblicherweise das >Dezimalsystem, ein sogenanntes Stellenwertsystem mit 
der Basis 10. Bei einem Stellenwertsystem hängt es von der Position einer Ziffer ab, für welchen 
Wert sie steht. 

Dezimalzahl: 4 3 0 3 


10°? 102 10" 10° 


Stellenwerte: 1000 =100 10 =1 


Den Umgang mit den Dezimalzahlen sind wir gewohnt; wir können mit so codierten Zahlen 
ohne weitere Umrechnung sofort umgehen. Dabei entsteht der Zahlenwert, indem man die 
Produkte aus Stellenwert und zugeordneter Ziffer addiert: 


4-1000 + 3-100 + 0-10 + 3-1=4303 


Beim >Binärsystem (>Dualsystem) können an jeder Stelle nicht zehn verschiedene Ziffern wie 
beim Dezimalsystem stehen (0 bis 9), sondern nur zwei (0 oder 1). Damit kann jede Stelle genau- 
so viel Information speichern wie ein Bit. Wegen der anderen Basis 2 sind die Stellenwerte hier 
verändert: 

Binärzahl: 1 0 0 1 


Stell te: 
ellenwerte _s Br -$ Zi 


Die Umcodierung ins Dezimalsystem funktioniert genau nach demselben Prinzip: 


1001, = 1:8 + 0:4 + 0:2 + 1:1 = 9% 


Umgekehrt zerlegt man eine Dezimalzahl in die Stufenzahlen des Binärsystems: 


220 = 1:16 + 0-8 + 1-4 + 1:2 + 0-2 = 10110, 


Vom Bit zum Byte 

Würde man zwei Binärzahlen unterschiedlicher Länge direkt hintereinander in den Speicher 
schreiben, könnte ein Computer nicht feststellen, an welcher Stelle die eine Zahl endet und die 
andere Zahl beginnt. Es ist daher erforderlich, Zahlenblöcke mit festgelegter Stellenanzahl zu 
verwenden und kürzeren Zahlen führende Nullen voranzustellen. 

Damit allen wichtigen Zeichen (etwa Großbuchstaben, Kleinbuchstaben, Sonderzeichen) eine 
Zahl als Codierung eindeutig zugeordnet werden kann, muss ein Zahlenblock aus ausreichend 
vielen Speicherzellen bestehen: 


Mit jedem weiteren Bit 
verdoppelt sich die Anzahl 


der darstellbaren Werte ... 


be 


[ON AnzahlStellen| 1 | 2 | 
SQ 

ya darstellbare| 0 | 00 000 
Werte | 1 01 001 
10 010 
11 011 

2|4| 

2 ‚2 


Mit 8 Bit lassen sich 2° = 256 Zahlen und damit auch 256 Zeichen codieren. Diese Menge schien 
in den 1950er und 1960er Jahren ausreichend; zudem ist 8 eine Zweierpotenz. Beides waren 
maßgebliche Kriterien dafür, dass sich diese Stellenanzahl durchsetzte. Die Datenmenge von 8 
Bit nannte man 1 >Byte. 


ee 
12027 
3AF 


> lat. decem: zehn, 
also Zehnersystem 


> lat. bina: doppelt, 
paarweise, also 
Zweiersystem 


> lat. dualis: zwei 
enthaltend, also 
Zweiersystem 


Um Codierungen 
eindeutig zu 
unterscheiden, wird 
die jeweilige Basis 
tiefgestellt 
angegeben. 


... 101101110110... 


01011011 
00010110 


> Byte: Kunstwort, 
urspr. Schreibweise 
bite („Bissen”) in 
Abgrenzung zu bit 
(verstanden als 
„Häppchen“) 
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128 
10073 : 
32a r 2 Codierung 


> Hexadezimal- 
system von von 
griech. hexa „sechs” 
und lat. decem 
„zehn‘, also 
Sechzehnersystem 


Genauere 
Informationen zum 


RGB-System gibt es 
in Aufgabe 9! 


Der umgekehrte 
Weg führt wieder 
über die Zerlegung 
in die Stufenzahlen 


des Hexadezimal- 
systems. 
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Hexadezimalsystem 


Digitale Farbangaben - etwa für Webseiten oder in Bildver- ag .gemischte 


arbeitungsprogrammen - erfolgen häufig im RGB-Farb- Farbe 


raum: Eine Farbe wird darin aus den Anteilen der drei Ir 
dezimal 


Grundfarben Rot, Grün und Blau „gemischt“. Für jeden An- 
teil steht oft 1 Byte (also 256 Werte von 0 bis 255) zur Ver- 


.. Os 
fügung. r — 
Die drei Farbanteile werden häufig wie rechts im Beispiel = 1 
im sog. >Hexadezimalsystem, einem Stellenwertsystem J 


mit Basis 16, codiert. Für die hierzu nötigen 16 Ziffern be- 
nutzt man neben den Ziffernsymbolen O bis 9, die aus dem 
Dezimalsystem vertraut sind, die Buchstaben A bis F für die 
Wertigkeiten 10 bis 15. 


Hex-Zahl: D 2 E 
Stellenwerte: w aM > 
" =256 =16 =1 
D2E, =13.256 + 2:16 + 14-1 =3374,, 


Erfahrene Benutzer, Programmentwicklerinnen oder Hacker 

kommen häufiger mit dem Hexadezimalsystem in Berüh- 

rung: Sie öffnen Dateien bei Bedarf in einem sogenannten 

Hex-Editor. Die Dateien sind hier beliebig veränderbar, wäh- 

rend Standardprogramme oft nur einen eingeschränkten 

Funktionsumfang bieten.DieWertederbinärgespeicherten Zahlen bis 15 codiert in drei 

Daten werden im Hex-Editor byteweiseangezeigt(undnicht '*lenwertsystemen 

z.B. als Bild- oder Textdokument interpretiert) und können einzeln verändert werden. Das Hexa- 

dezimalsystem zeigt die Binärdaten außerdem deutlich verkürzt in übersichtlichen Byte-Blöcken. 
binär codierte Bild- 

Einfache Umrechnung zwischen Binär- und Hexadezi- daten im Speicher 

malsystem (schematisch) 

Die Information eines Bytes (2° = 256 = 16? Werte) wird im 10011010111001011000101 

Hexadezimalsystem also nur durch zwei Zeichen ausge- 

drückt. Zur Umrechnung zwischen den eoderungen Ki 6. = : = Bee 

lediglich dieKenntnisderjeweiligenZahlendarstellungvon ?° Aa CC 

O bis 15 erforderlich (vgl. Tabelle): Darstellung der N 


Daten im 
Hex-Editor 
BIOMLER 2A (Ausschnitt) 
5 u vom Grafikprogramm 
E7is 0010 1010, interpretierte Darstel- 


lung der Binärdaten 


Information muss für die digitale Verarbeitung durch Bitmuster ausgedrückt werden. Dazu 
wird sie im Binärsystem codiert (Basis 2). Eine kürzere und einfach ins Binärsystem über- 
tragbare Darstellung der Werte kann mit dem Hexadezimalsystem erreicht werden (Basis 
16). Beide Systeme sind Stellenwertsysteme. 

Ein Bit ist die kleinste digitale Informationseinheit und kann zwei Werte darstellen; acht Bit 
bilden ein Byte. 


12233 
2.2 Was der Computer versteht: Bits, Bytes & Zahlensysteme 3 = 2 


Aufgaben 


1 Richtig oder falsch? 8 Q 


Entscheiden Sie, ob die Aussagen wahr oder falsch sind, und berichtigen Sie falsche Aussagen. 

a Der höchste Wert der Einerstelle beim Hexadezimalsystem ist 16. 

b Mit einer vierstelligen Binärzahl können 2* = 16 verschiedene Werte dargestellt werden. 

c Mit einem Byte können acht verschiedene Werte dargestellt werden. 

d Dass ein binär codiertes Zeichen endet und ein neues beginnt, erkennt ein Computer an 
einem besonderen Trennzeichen im Speicher. 

e Ein Byte kann hexadezimal mit zwei Zeichen dargestellt werden. 

f Um eine Zahl im Dezimalsystem zu codieren, multipliziert man die Summen aus Stellen- 
wert und zugehöriger Ziffer. 


Zum Geburtstag viel Glück - und wenige Kerzen ° G) 
Mina ist irritiert, als sie zum 17. Geburtstag die abgebildete Torte mit nur 9, j 


An welchen 
Geburtstagen 
kommt eine weitere 
Kerze dazu? 


fünf Kerzen erhält - und drei davon brennen nicht einmal ... Ihre Gäste 
können sie aber schnell beruhigen: „Auf diese Weise werden wir nie das 
Problem haben, dass nicht genügend Kerzen auf die Torte passen. Und 


das dargestellte Alter stimmt trotzdem!” a. 
a Ermitteln Sie zu zweit, nach welchem Prinzip Minas Bee 


vorhandenen Kerzen 
brennen, an welchen 
nur eine? 

Welche Anzahl von 
Kerzen wird auch 
im hohen Alter 
ausreichend sein? 


Gäste ihr Alter dargestellt haben, und beantworten 
Sie Minas Fragen aus der Sprechblase. 
Minas Eltern sind verschieden alt, haben aber am selben 
Tag Geburtstag. Mina ist überzeugt vom Kerzensystem 
und schenkt beiden Eltern eine Torte nach demselben 
Konzept. 
b Diskutieren Sie anhand des Beispiels zu zweit, woran 
man sofort erkennen kann, wer von den beiden älter 


ist, ohne jeweils das Alter tatsächlich zu bestimmen. 245 a # \ 

Formulieren Sie dazu ein allgemeines Prinzip. N 
c Für Schnelle: Minas Vater ist doppelt so alt wie Minas älterer Bruder Ben, Minas Oma ist | 

doppelt so alt wie Minas Vater. Überlegen Sie anhand der Grafiken, wie man aus einer | 


Zahl die Darstellung ihres Doppelten folgern kann, und schreiben Sie dann eine allge- 
meingültige Regel dafür mit kurzer Erklärung auf. 


Umwandlungen ins Dezimalsystem [6) & 
Ein Teil einer ASCII-codierten Datei ist in a) wie im Speicher abgelegt dargestellt, ein anderer 
Teil ist in b) dargestellt, wie er beim Öffnen im Hex-Editor erscheint. 
Wandeln Sie die Werte ins Dezimalsystem um und ermitteln Sie dann mit Hilfe einer ASCII- 
Tabelle, was sich hinter den Codierungen verbirgt. 
a 00111010,, 00101101,, 01110000, 
b 3A, 27,6, 7Dis 
c Für Schnelle: Überprüfen Sie, indem Sie die Werte aus a) ins Hexadezimalsystem 
übertragen und die Hex-Zahlen aus a) und b) dann in einen Hex-Editor eintragen. 


1+1=10 Die Menschheit zerfällt in 10 Gruppen: © 
diejenigen, die das Binärsystem verstehen, 


Erklären Sie die Pointen von Sprechblase und nern 


Aufgabentitel. 
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23 
daosT 
3AF 


ABK: 


Fa 


ba 


Ban 7? 


> ASCIl: American 
Standard Code for 
Information 
Interchange 
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2 Codierung 


Umwandlungen vom Dezimalsystem 
Der folgende Algorithmus beschreibt die Umcodierung einer Zahl n vom Dezimalsystem ins 
Binärsystem: 
wiederhole solange n > 0 
dividiere n durch 2, bestimme Ergebnis und Rest 
notiere den Rest als nächste Binärziffer (von rechts nach links!) 
speichere das Ergebnis als neues n 


endewiederhole 


a Vollziehen Sie zu zweit mit Hilfe des Algorithmus nach, dass sich für 13 die Binärdarstel- 
lung 1101 ergibt. Notieren Sie die Einzelschritte strukturiert. 

b Wandeln Sie durch (schriftliche) Anwendung des Algorithmus die Dezimalzahlen 29, 93 
und 748 ins Binärsystem um. 

c Beschreiben Sie, welche Veränderungen am Algorithmus vorgenommen werden müssen, 
damit man ihn zur Umcodierung ins Hexadezimalsystem benutzen kann. Wandeln Sie 
dann die Zahlen aus b) ins Hexadezimalsystem um. 

d Setzen Sie den gegebenen Algorithmus am Computer um. 


Umrechnen leicht gemacht 

Zahlen zwischen verschiedenen Zahlensystemen umzurechnen, ist auf Dauer mühsam. Ent- 

wickeln Sie daher einen Umrechner, der Ihnen diese Arbeit abnimmt: 

a Übertragen Sie den folgenden Algorithmus, welcher eine erhaltene Binärzahl in eine De- 
zimalzahl umcodiert, in Ihre Programmiersprache: 


methode BinärInDezimalUmrechnen (binärzahl: ZEICHENKETTE) 
Variable dezimalzahl mit 0 initialisieren 
Variable stellenwert mit 1 initialisieren 
wiederhole solange Länge (binärzahl) > 0 
letztes Zeichen der Zeichenkette in Ziffer umwandeln, als # 
aktuelleZiffer speichern 
letztes Zeichen der Zeichenkette entfernen 
aktuelleZiffer mit stellenwert multiplizieren, Ergebnis zu 
dezimalzahl addieren 
stellenwert verdoppeln 
endewiederhole 
endemethode 


b Ergänzen Sie eine Möglichkeit, um eine hexadezimale Zahl in eine Dezimalzahl umzuco- 
dieren. Hinweis: Beachten Sie, dass Hex-Ziffern als Dezimalziffern und Buchstaben vorlie- 
gen können. Die zu einer Hex-Ziffer gehörige Dezimalzahl muss also vorab zugeordnet 
werden. 

c Für Schnelle: Passen Sie Ihren Algorithmus für eine weitere Basis an. 


Zeichen mit dem ASCII-Code codieren 

Damit Texte mit ihren Buchstaben, Satzzeichen usw. digital gespeichert oder übertragen wer- 

den können, müssen die einzelnen Zeichen zunächst binär codiert werden. Ein für diesen 

Zweck weit verbreitetes Codierungsverfahren ist der >ASCII-Code. 

a Beim ASCII-Code wird jedes Zeichen zunächst durch 7 Bit repräsentiert. Berechnen Sie, 
wie viele verschiedene Zeichen mit diesem System darstellbar sind. 

b Codieren Sie „Hallo“ zunächst als ASCII-Zeichencodes im Dezimalsystem und übertragen 
Sie die Zahlenwerte anschließend ins Binärsystem. Nutzen Sie eine ASCII-Codetabelle im 
Internet. 


2.2 Was der Computer versteht: Bits, Bytes & Zahlensysteme 


Moderne Computer arbeiten mit Einheiten von 8 Bits (=1 Byte). Ein ASCII-Zeichen wird daher 

heutzutage in der Regel durch 8 Bits dargestellt. Das vom ursprünglichen ASCII-Code nicht 

genutzte achte Bit kann dabei als sogenanntes Paritätsbit zur Fehlererkennung verwendet 
werden. Beispielsweise kann an die 7 Datenbits ein weiteres Bit angefügt werden, sodass die 

Anzahl der Bits mit Wert 1 für ein Zeichen stets ungerade ist. Beispiele: 

- 0101 1101 - Anzahl der Bits mit Wert 1 gerade > 1 anhängen 
- 0101 1000 - Anzahl der Bits mit Wert 1 ungerade > 0 anhängen 

c Erweitern Sie die Binärdarstellung aus Teilaufgabe b) um die entsprechenden Paritätsbits. 

d Erläutern Sie, wie mithilfe des Paritätsbits Fehler bei der Übertragung eines Zeichens er- 
kannt werden können, und gehen Sie dabei auch auf die Grenzen dieses Fehlererken- 
nungssystems ein. 

e Bei der ASCIl-Codierung des Wortes „schön“ tritt ein Problem auf. Beschreiben Sie das 
Problem und seine Ursache und recherchieren Sie verschiedene Möglichkeiten, um das 
Problem zu lösen. 

f Für Schnelle: Heutzutage wird der weltweite Standard Unicode benutzt. Recherchieren 
Sie Vorteile von Unicode gegenüber ASCII und wie beide zusammenhängen. 


Speicherplatz 

Auf unterster Ebene ist die Betrachtung einzelner Bits zwar relevant, im Alltag werden aber 

größere Einheiten für Speicherkapazitäten verwendet. 

a Recherchieren Sie mindestens die vier nächstgrößeren Einheiten nach Bit und notieren 
Sie die Einheiten in einer Tabelle. Sortieren Sie dann die folgenden Daten aufsteigend 
nach durchschnittlicher Dateigröße. 

FürSchnelle:Ordnen Sie auch jeweils einerealistische Dateigröße in einer passenden Einheit 
zu. 


b Kreszentia kauft eine Festplatte, die laut Herstellerangabe eine Kapazität von, „2 Terabyte” 
hat. Nachdem sie die Festplatte eingebaut hat, zeigt ihr Computer allerdings nur 1,86 TB 
Kapazität an. Recherchieren und erklären Sie die Ursache des Unterschieds (Stichwort: De- 
zimal- bzw. Binärpräfixe). Überlegen Sie sich anschließend eine mögliche Erklärung für die 
Einheitenwahl der Firma. 

c Für Schnelle: Welche Variante der Einheiten auf einem Computer benutzt wird, ist vom Be- 
triebssystem abhängig. Untersuchen Sie die Eigenschaften Ihrer Festplatte und schließen 
Sie aus z. B. einer Angabe von Bytes und Gigabytes, welche Variante verwendet wird. 
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uQa 


Wie viele verschie- 
dene Farben können 
nach dem beschrie- 
benen System ins- 
gesamt dargestellt 
werden? 


aa 
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9 Farben im RGB-System codieren 

Im RGB-System können Farben auf Basis dreier Grundfarben durch additive Farbmischung 
erzeugt werden. Dazu ist die Angabe ihrer jeweiligen Rot-, Grün- und Blauanteile notwendig. 
Häufig stehen zum Speichern jedes Farbanteils 8 Bit zur Verfügung. Damit lassen sich pro 
Farbe 28 = 256 Abstufungen (von 0 bis 255) darstellen. 0 steht für eine komplett ausgeschal- 
tete Farbe, 255 für 100%ige Sättigung. Die Beschreibung ist in verschiedenen Codierungen 
möglich: 

RGB(255, 0, 0) 


#FF0000 RGB(255, 0, 255) 


#FFOOFF 


RGB(0, 255, 0) 
#00FFOO 
a Geben Sie je zwei Codierungen der vier Farben, die nicht mit einer Legende versehen 
sind, in dezimaler bzw. in hexadezimaler Codierung an. 
Erklären Sie dann, welche Art Codierungsfehler bei einer Farbangabe im Hex-Format im 
Vergleich zur Angabe im Dezimalformat (unter Berücksichtigung der jeweils gültigen 
Zeichen!) ausgeschlossen ist. 
b Ordnen Sie den abgebildeten Farbklecksen je eine der gegebenen Codierungen zu. 


de Ze; 


c Von Ihrer Lehrkraft erhalten Sie eine Bilddatei mit zwei Farben. Ermitteln Sie, welche bi- 
nären Werte der Computer für diese beiden Farben im RGB-System speichern muss. Ver- 
wenden Sie zur Ermittlung der Farbwerte die Pipettenfunktion und die Farbpalette eines 
Grafikprogramms. 

d Ein Computer hat die Farben der schematisch dargestellten Flaggen gespeichert. Finden 
Sie heraus, für welches Land die Flagge jeweils steht. (Hinweis: Für die erste Flagge ist 
das im Kopf möglich!) 


#EF59A1 
#0B090C 
#00B036 


11111111 00000000 00000000 
00000000 01011011 10111011 


11111111 11010101 
11111111 00000000 00000000 ae 


10 What the hex?! 
Vertiefen Sie Ihre Kenntnisse über das RGB-System und das Hexadezimalsystem, indem Sie 
beim Spiel "What the hex?!" versuchen, die gegebenen Farbcodes einer der dargestellten 
Farben korrekt zuzuordnen. 
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2.2 Was der Computer versteht: Bits, Bytes & Zahlensysteme 


Farbverlaufspaletten programmieren 
Für die Gestaltung digitaler Inhalte findet man im Internet Farbpaletten: Darin sind für unser 
Auge gut zusammenpassende Farben aufgeführt. Oft folgt unser ästhetisches Empfinden 
hier mathematischen Regeln. Am Beispiel einer Farbverlaufspalette lässt sich dies 
gut nachvollziehen: 
a Vollziehen Sie für die abgedruckte Beispielpalette nach, um wie viel sich die Rot-, Grün- 
und Blauanteile von Balken zu Balken jeweils unterscheiden. 
b Eine Vorlage zum Zeichnen eines einzelnen Farbbalkens ist bereits gegeben. Analysieren 
Sie den Quelltext. 
c Entwickeln Sie einen Algorithmus zum Zeichnen einer vierstufigen Farbpalette gemäß 
folgenden Anforderungen: 
« Die Nutzerinnen und Nutzer können eine Start- und eine Zielfarbe eingeben. 
« Eine Methode BerechneFarbunterschied(Startfarbe, Endfarbe) berechnet für die einzel- 
nen Farbwerte die Differenz zwischen den benachbarten Balken. 
« Die vier Balken werden so positioniert, dass sie direkt aneinander anschließen. 
d Erweitern Sie Ihr Programm so, dass die Nutzerinnen und Nutzer in einem sinnvollen 
Rahmen die Anzahl der gewünschten Balken wählen können. 


Verwenden Sie für diese Aufgabe ein 
Grafikprogramm, das das Format 
Portabel Anymap beherrscht und bei 
dem die Anzeigeoption „Resampling 
beim Zoomen“ deaktivierbar ist, 


Pixelbilder codieren 

Digitale Raster-Bilder bestehen aus einzelnen, meist 
quadratischen Bildpunkten (>Pixeln), die jeweils eine 
eindeutige Farbe haben. 

Ein einfaches Dateiformat für die Speicherung von damit die Pixel klar abgegrenzt 
Pixelgrafiken ist Portable Anymap. Damit wird der ie ee N 
grafische Inhalt der Datei zunächst im Dateikopf wie [&) 


folgt codiert: | 


spezielles Format der Bilddaten (P1 bis P6) 
ER Pl Leerzeichen fe) 
Bildbreite (in Pixeln) —— 6 Fr Bildhöhe (in Pixeln) 


9 
Pl 255 Beschreibung aller einzelnen Pixel, 
Maximalwert für Farbangaben , AR abhängig vom oben angegebenen Format 
(nur bei farbigen Bildern!) 


a Öffnen Sie den bereitgestellten Smiley mit einem Grafikprogramm und zoomen Sie so 
weit hinein, bis Sie die einzelnen Bildpunkte gut erkennen. 
Öffnen Sie die Datei dann in nichtinterpretierter Form mit einem Texteditor. Analysieren 
Sie zu zweit die Bedeutung aller Zeichen und ergänzen Sie eine Nase für den Smiley. (Für 
Schnelle: Erstellen Sie eine neue Bilddatei im Texteditor und codieren Sie Ihre Initialen.) 
b Für bunte Bilder muss die bisherige Codierung erweitert werden. Die Farbe eines Pixels 
wird durch drei Zahlen (hier zwischen O und 255 im RGB-Modus) beschrieben. 
(Hinweis: siehe dazu Vortext von Aufgabe 91) 
Das vorliegende 8x8 Pixel-große Icon der Webseite einer Aufzuchtstation für Papageien- 
waisen ist noch nicht vollständig. Analysieren Sie zu zweit den Dateiaufbau und modifi- 
zieren und ergänzen Sie die Datei im Texteditor so, dass das abgebildete Icon entsteht. 
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BHA 


> Pixel, das: gebildet 


aus ugs. Begriff für 


pictures ?pics>pix 


und element, also 
-[kleinstes] 
Bilderelement 
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> NRZ (non-return 

to zero) bedeutet, 
lass es keinen neut- 
ralen Zustand gibt, 

sondern jeder Zu- 
stand eine Informati- 
on trägt. 


D > 


2 Codierung 


c Für Schnelle: Das Format aus der vorigen Teilaufgabe existiert auch in Binärcodierung. 
Zur Bearbeitung der Datei wird nun ein Hex-Editor benötigt. Analysieren Sie den Datei- 
kopf zu zweit. Modifizieren Sie dann eine Kopie des Bilds im Stil des Popart-Künstlers 
Andy Warhol, indem Sie Hintergrund- und Hautfarbe austauschen. 

(Hinweise: Analysieren Sie die Farben zuerst mit Hilfe der Pipettenfunktion eines Grafik- 

programms. Nutzen Sie im Hex-Editor dann die Funktion Suchen und Ersetzen und ver- 

gessen Sie nicht, anschließend zu speichern!) 

Bewerten Sie Ihr Vorgehen im Vergleich zur Funktion „Fülleimer“ eines Grafikprogramms 
und beurteilen Sie, für welche Anwendung welches der vorgestellten Dateiformate bes- 
ser geeignet ist. 

d Für ganz Schnelle: Erstellen Sie weitere Variationen und setzen Sie alle zu einer Collage 
zusammen. 


13 Daten im Kabel übertragen: Leitungscodierung 


Ein weit verbreitetes Übertragungsmedium für digitale Daten sind Kupferkabel. Dabei wer- 

den die Binärziffern „1“ und „O“ in der Regel durch unterschiedlich hohe Spannungspegel 

repräsentiert. Die Umwandlung der Daten in ein für das Medium geeignetes Format bezeich- 

net man auch als Leitungscodierung. 

a Eine sehr einfache Leitungscodierung ist das unten gezeigte >NRZ-Verfahren. Beschrei- 
ben Sie die Codierungsregeln für dieses Verfahren und ermitteln Sie die im Beispiel 
übermittelte Bitsequenz. 


1 0 0 1 


Spannungspegel 


Zeit 


b Bei Bitsequenzen mit vielen aufeinander folgenden Nullen oder Einsen kommt es beim 
Einsatz von NRZ leicht zu Übertragungsfehlern. Beschreiben Sie aus Sicht des Empfän- 
gers, welches Problem in diesen Fällen auftritt. 

< Bei der Datenübertragung über USB-Verbindungen wird die Leitungscodierung NRZI 
verwendet. Die folgende Grafik zeigt die gleiche Bitsequenz wie in Teilaufgabe a), dies- 
mal als NRZI codiert. 

Geben Sie auch für NRZI die allgemeinen Codierungsregeln an und beurteilen Sie, in- 
wieweit damit die Probleme aus Teilaufgabe b) vermieden werden. 


Spannungspegel 


Zeit 


d Für Schnelle: Der USB-Standard verwendet sogenanntes,bit stuffing“, um eine trotz NRZI 
verbleibende Gefahrenquelle für Übertragungsfehler zu unterbinden. Recherchieren Sie, 
wie „bit stuffing“ bei USB funktioniert, und geben Sie eine Beispielbitsequenz an, bei der 
es zum Einsatz kommt. 
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2.2 Was der Computer versteht: Bits, Bytes & Zahlensysteme 


Die Binärdarstellung ausnutzen: Hacken für Einsteiger 

a Starten Sie das Spiel, indem Sie die mitgelieferte class-Datei 
(z. B. wie von der Figur beschrieben) ausführen. Probieren 
Sie das Spiel kurz aus. 

Da für das Spiel nur die bereits in unleserlichen Code übersetzte 

class-Datei vorliegt, kann der Quellcode eigentlich nicht 

mehr sinnvoll bearbeitet werden ... Als Möglichkeit, den Code 


Die class-Datei können 

Sie auf jedem Rechner 
ausführen, auf dem Java 
installiert ist, Probieren 

Sie es einfach aus, z.B. 
indem Sie das mitgelieferte 
Skript starten, das zu Ihrem 
Betriebssystem passt. 


nachträglich noch zu modifizieren, können Sie die Datei aller- * —Q 
dings in einem Hex-Editor öffnen! & 
b Beim Einsammeln einer Münze erhält man 200 Taler. Um schneller an mehr 

Geld zu kommen, wäre es praktisch, pro Münze 210 (für Profis: immer 

gleich das Doppelte) zu erhalten. Codieren Sie den fraglichen Wert hexade- | | 


zimal und suchen Sie im Hex-Editor, wo der Wert auftritt. Manipulieren Sie 
ein Auftreten des Werts entsprechend und überprüfen Sie, ob sich die Änderung wie ge- 
wünscht auswirkt (ansonsten müssen Sie ein anderes Auftreten manipulieren). 

c Beim Klick auf den Button „Extra Level“ darf man eine andersfarbige Welt betreten - vor- 
ausgesetzt, man hat sich das richtige Passwort gekauft. 
Analysieren Sie den Programmcode im Hex-Editor und suchen sie dort nach menschen- 
lesbaren Zeichenketten, die das gesuchte, eigentlich geheime Passwort sein könnten. 


Binäres Zählen 

a Schneiden Sie zu zweit die Karten einer Vorlage aus, legen Sie die Karten absteigend 
sortiert nebeneinander und drehen Sie beliebige Karten um, so dass sie deren Punkte 
nicht sehen können. Notieren Sie für eine Karte, deren Punkte Sie sehen, eine 1, für eine 
umgedrehte Karte eine 0. Zählen Sie dann den Dezimalwert der so entstandenen Binär- 
zahl an den Punkten ab. Reflektieren Sie zu zweit, warum das System funktioniert. 

b Zählen Sie von 1 an aufwärts, indem Sie Karten jeweils entsprechend umdrehen. Beob- 
achten Sie genau und folgern Sie allgemeine Regeln, gemäß derer das Zählen im Binär- 
system abläuft. 

c Testen Sie sich gegenseitig, indem Sie sich wechselweise (ohne die Karten) eine willkürli- 
che Binärzahl vorgeben und von dieser nach dem ermittelten System 1 hochzählen. 
Überprüfen Sie z. B. mit Hilfe eines Online-Tools. 

d Diskutieren Sie zu zweit in Bezug auf die Zeichnung rechts, wie weit Sie mit zehn Fin- 
gern zählen können. 


Wie rechnet man in Entenhausen? 

Vermutlich hat sich das Dezimalsystem entwickelt, weil die Menschen seit jeher ihre zehn 
Finger als Zähl- und Rechenhilfe benutzt haben. Viele Comicfiguren wie die Ducks haben nur 
vier Finger pro Hand (einer gängigen Annahme zufolge, um in den Anfängen des Trickfilms 
Zeit beim Zeichnen zu sparen). 

Überlegen Sie, welches Zahlensystem daher eigentlich in Entenhausen gelten müsste, und 
bestimmen Sie, wie Onkel Dagobert sein Vermögen in diesem System angeben muss, wenn 
er sagen möchte, dass er 50 Geldspeicher (für Schnelle: 123000 Talersäcke) besitzt. 
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Die Beispiele 
beschränken 

sich auf die 26 
Großbuchstaben 
ohne Satz- und 
Leerzeichen. Das 
Verfahren kann 
genauso auf andere 
Zeichenvorräte 
erweitert werden. 
Gelangt man beim 
Verschieben zum 
letzten Buchstaben, 
beginnt man wieder 


© 
h 


von vorne, 


2.3 Im Geheimen kommunizieren: Symmetrische Verschlüsselung 
Klara ahnt, dass ihre beiden jün- 


geren Brüder etwas aushecken, [s [eJoJelelo|rlı ls |«[ı 


da sie ihre Nachrichten unterein- A | {0} m] © * y | v + - | = db eo © 

ander verschlüsseln und jeden lolelajels|r/ulv/w|x|v| 

Buchstaben durch ein bestimm- 

tes Symbol ersetzt haben. Gut, alejajx|o|«/e|x|r|>je|r 

dass Klara die Codierungsvor- 

schrift bereits herausgefunden 
hat. 

a Entschlüsseln Sie die folgende Nachricht, die Klara im Flur gefunden hat: 
ODALIIAIO-BOBAD<SAND+® 

b Nutzen Sie das System, um sich gegenseitig eine kurze Nachricht zu schreiben. 

c Die beiden Brüder vermuten, dass Klara ihre Nachrichten entschlüsseln kann, und 
scheinen daher den Buchstaben andere Figuren zugeordnet zu haben. Untersuchen 
Sie die Häufigkeiten aller Figuren in der geheimen Nachricht (siehe Datei) und verglei- 
chen Sie diese mit den Buchstabenhäufigkeiten in Goethes Faust (siehe Abbildung 
nächste Seite). Schaffen Sie es, die Nachricht zu entschlüsseln? 


7 
03 


Codierung zur Verschlüsselung nutzen 

Egal, ob Ablage wichtiger Daten, Chats mit Freundinnen und Freunden oder Onlinebanking: Es 
gibt Informationen, die nur für bestimmte Personen, nicht aber für neugierige Dritte bestimmt 
sind. Um solche Informationen sicher abzulegen oder im Geheimen zu übertragen, kann man 
Codierungsregeln nutzen. Den Vorgang, eine Nachricht so zu codieren, dass Unbefugte die In- 
formation nicht einfach mitlesen können, nennt man Verschlüsselung. Zum Ver- bzw. Entschlüs- 
seln wird eine bestimmte Information benötigt, der sogenannte Schlüssel. Ohne den passenden 
Schlüssel ist eine Entschlüsselung nicht ohne weiteres möglich. 


Cäsar-Verschlüsselung 

Die Notwendigkeit, Informationen zu verschlüsseln, existiert nicht erst seit den Tagen des Inter- 
nets. Angeblich verwendete schon derrömische Feldherr Gaius Julius Cäsar ein Verschlüsselungs- 
verfahren, um geheime Nachrichten mit seinen Offizieren auszutauschen. Bei der nach ihm be- 
nannten Cäsar-Verschlüsselung wählt man einen Buchstaben als geheimen Schlüssel und 
verschiebt jeden Buchstaben der Nachricht entsprechend der Stelle des Buchstabens im Alpha- 
bet weiter. Aus dem Klartext „ANGRIFF“ wird mit dem Schlüssel C - C ist der dritte Buchstabe im 
Alphabet! - beispielsweise der um drei Buchstaben verschobene Geheimtext „DQJULII”.. Der 
Empfänger muss lediglich im Besitz dieses Schlüssels sein, um den Text wieder zu entschlüsseln. 


Klartextalphabet 


Schlüssel: C 
(3. Buchstabe) 


Geheimtextalphabet 
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Cäsar-Verschlüsselung knacken 
Bei Verfahren wie der Cäsar-Verschlüsse- IIT1 
lung wird nur eine Zuordnung von 1>000 
Klartext- zu Geheimtextbuchstabefürdie 125000 
Verschlüsselung verwendet (>mono- ETofuroroppnt BE RT BB BR RR RR KR RR RK 
alphabetische Verschlüsselung). Dadurch 

ne j 750-000 05 I 
wird jeder Klartextbuchstabe immer 
durch denselben Geheimtextbuchstaben || IM | 1 
ersetzt.Man kann deshalb versuchen, den 250-005 5 ua u l | | er 
Schlüssel zu bestimmen, indem man die o-Z2 22 u Il Lıı 
Häufigkeiten der einzelnen Buchstaben ENISRHTADLUCMGOBW 
im Geheimtext zählt und mit Statistiken Buchstabenhäufigkeiten in Goethes Faust 
zur Buchstabenhäufigkeit in der jeweili- 
gen Sprache vergleicht. Beispielsweise ist der häufigste Buchstabe in deutschsprachigen Texten 
das E. Ist der häufigste Buchstabe im Geheimtext nun K, ergibt sich als Schlüssel mit hoher Wahr- 
scheinlichkeit 6 - der Abstand zwischen E und K. Damit eine solche Häufigkeitsanalyse funkti- 
oniert, muss der Text jedoch hinreichend lang sein. 
Die Cäsar-Verschlüsselung ist aber noch aus einem anderen Grund leicht zu knacken, denn es 
existieren insgesamt nur 26 mögliche Schlüssel, die sich relativ schnell durchprobieren lassen. 
Einen solchen Angriff, bei dem man versucht, den Schlüssel durch Ausprobieren aller Möglich- 
keiten zu ermitteln, nennt man >Brute-Force-Angriff. 


Vigenere-Verschlüsselung 

Der Franzose Blaise de Vigen£re griff die 
Idee der Cäsar-Verschlüsselung auf und 
verbesserte sie, indem er mehr als eine 
Zuordnung von Klartext-zu Geheimtext- 
buchstabe verwendete, damit ein Klar- 
textbuchstabe nicht stets durch densel- 
ben Geheimtextbuchstaben ersetzt wird 
(>polyalphabetische Verschlüsselung). 
Schreibt man alle Alphabete, die mit der 
Cäsar-Verschlüsselung möglich sind, sys- 
tematisch untereinander, erhält man das 
Vigenere-Quadrat, das zur Ver- und Ent- 
schlüsselung verwendet wird. AlsSchlüs- 
sel wird nicht mehr nur ein Buchstabe, 
sondern ein ganzes Wort verwendet. 


Schlüsselbuchstaben Klartextbuchstaben 
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Geheimtextbuchstaben 


Ausschnitt aus Vigenere-Quadrat 


Die Buchstaben aus Schlüssel und Klartext geben zusammen das Feld im Vigenere-Quadrat an, 
das den Geheimtextbuchstaben darstellt: Aus Schlüsselbuchstabe C und Klartextbuchstabe G 
ergibt sich Zeile C und Spalte G und damit Geheimtextbuchstabe I. 


Schlüssel CAFECAFECAF = ; 
\_- Verschlüsselung mit 
Klartext GEHEIMEINFO 


dem Schlüssel CAFE 
Geheimtxt IEMIKMJMPFT 


Im 16. Jahrhundert galt Vigen£&res Verschlüsselungsverfahren als kaum entschlüsselbar. Aus heu- 
tiger Sicht lässt sich das allerdings nicht mehr behaupten: Ist der verschlüsselte Text lang genug, 
lässt sich die Schlüssellänge herausfinden und das Problem auf das Knacken einer monoalpha- 
betischen Verschlüsselung zurückführen. 


> von griechisch 
HöVo (mono) = 
„einzig“ 


> Brute Force heißt 
wörtlich übersetzt 
„rohe Gewalt“ 


> von griechisch 
noAüc (polys) =,viel“ 


Wie Sie das 
Vigenere-Verfahren 
knacken können, 
finden Sie in 


Aufgabe 3 heraus. 
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Symmetrische Verschlüsselungsverfahren 
Beide vorgestellten Verfahren gehören zu 
den sogenannten symmetrischen Ver- 


gänglich sind. Richten Sie sich eine Passwortdatenbank auf Ihrem privaten Gerät ein und 
nutzen Sie diese mindestens für die nächsten vier Wochen. Richten Sie für jeden Dienst 
ein zufällig generiertes, ausreichend langes Passwort ein. Wägen Sie Mehraufwand bzw. 


Verschlüsselung 


schlüsselungsverfahren. Bei solchen gibt es MAWS!) Praktikabilität und die Sicherheit im Vergleich zu Ihrem bisherigen Verfahren gegeneinan- 

nur einen Schlüssel, der sowohl für die Ver- einziger S4P@a< der ab. 

als auch für die Entschlüsselung verwendet Schlüssel 3852 

wird. Als sicher gilt eine Verschlüsselung 3 Vigenere-Verfahren brechen [6) 


dann, wenn ein Herausfinden desKlartextes Klartext 2 Geheimtext 
. Eee ca j Entschlüsselung 

ohne Schlüssel unmöglich ist oder es zumin- 

dest kein Verfahren dafür gibt, das wesentlich schneller arbeitet als das Durchprobieren aller 

möglicher Schlüssel dauert. Ein solcher Brute-Force-Angriff sollte mindestens so lange dauern, 

wie die verschlüsselte Information geschützt werden soll. 


Es ist wesentlich schwieriger, das Vigenere-Verfahren zu knacken als die Cäsar-Verschlüsse- 

lung, aber es ist durchaus möglich. Gehen Sie dazu wie folgt vor: 

a Bestimmen Sie rechnerisch, wie viele Schlüssel durchprobiert werden müssen, wenn der 
Vigenere-Schlüssel 5, 10 bzw. 20 Zeichen lang ist. Gehen Sie davon aus, dass der Schlüssel 
nur aus den 26 Großbuchstaben besteht und kein sinnvolles Wort ergeben muss. 

b Begründen Sie, warum die Sicherheit des Vigenere-Verfahrens mit steigender Schlüssel- 
länge zunimmt und warum die verwendete Schlüssellänge nicht offen kommuniziert wer- 
den sollte. 

c Mit dem Kasiski-Verfahren kann man Nachrichten, die mit dem Vigenere-Verfahren ver- 
schlüsselt wurden, ohne Kenntnis des Schlüssels dechiffrieren. Zu diesem Zweck muss die Der Abstand it 
Länge des Schlüssels bestimmt werden. Dazu sucht man nach sich wiederholenden Buch- | 9-3*3, also könnte 
stabenfolgen, bestimmt deren Abstand wie im Beispiel gezeigt und zerlegt diese Zahl in 


Verschlüsseln ist das Codieren eines Klartextes mit Hilfe eines Schlüssels in einen Geheim- 
text, um Informationen geheim zu speichern oder zu übertragen. Eine Entschlüsselung ist 
nur mit einem passenden Schlüssel möglich. Bei der symmetrischen Verschlüsselung gibt 
es nur einen Schlüssel, der sowohl für die Ver- als auch Entschlüsselung verwendet wird. Bei 
einer Häufigkeitsanalyse werden Buchstabenhäufigkeiten im Geheimtext analysiert, um 
Rückschlüsse auf den Klartext zu ziehen. Bei einem Brute-Force-Angriff werden verschie- 
dene Zahlen- bzw. Zeichenkombinationen systematisch ausprobiert, um z.B. den richtigen 
Schlüssel zur Entschlüsselung eines Geheimtextes zu finden. 


der Schlüssel die 


ihre Primfaktoren. Die Primfaktoren und alle Vielfachen sind dann Kandidaten für die ei er. 


Schlüssellänge: 


Schlüssel KEYKEYKEYKEYKEYKEYKEYKEYKEYKEYKEYKEY N 
Klartext TREFFENVONSONNTAGAUFMONTAGVERSCHOBEN 
Aufgaben Geheimtext DvcePrscxzmxwmxesKkrrovomumuıı 
jun EN 
Abstand 9=3 3 


| 1 Entdecken - Verstehen 


® 
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ImTextwurden mit der Cäsar- und derVigenere-Verschlüsselung 

zwei Verschlüsselungsverfahren vorgestellt. In dieser Aufgabe 

werden Sie die beiden Verfahren selbst anwenden. 

a Nehmen Sie sich Stift und Papier und tauschen Sie eine mit 
dem Cäsar-Verfahren verschlüsselte Nachricht aus. 
Tipp: Suchen Sie online eine Cäsar-Scheibe oder basteln Sie 
aus der Dateivorlage einen Cäsar-Schieber (vgl. Bild). Dabei werden Klar- und Geheimtext- 
alphabet auf zwei unterschiedlich großen Kreisen oder Streifen angetragen und überei- 
nandergelegt. Durch Drehen bzw. Verschieben wird der Schlüssel eingestellt. 

b Suchen Sie online nach einem Vigenere-Quadrat und tauschen Sie mit Stift und Papier ei- 
ne mit dem Vigen£re-Verfahren verschlüsselte Nachricht aus. 


Selbst verschlüsseln 

MitgeeigneterSoftwarekönnen Sie beliebige Dateien auflhrem System ver-undentschlüsseln. 

a Im Download-Angebot finden Sie Informationen über für Ihr Betriebssystem geeignete 
Verschlüsselungssoftware für Dateien. Öffnen oder installieren Sie eine passende Soft- 
ware und verschlüsseln Sie ein Foto, ein Textdokument oder eine andere persönliche 
Datei. 

b Diskutieren Sie, welche Arten von Dokumenten auf diese Weise ausgetauscht werden 
sollten. 

c Fachleute empfehlen möglichst komplexe Passwörter zu verwenden. Diese sind allerdings 
schwer zu merken. Eine Lösung sind Passwortmanager, die Passwörter in einer verschlüs- 
selten Datenbank ablegen, sodass diese nur nach Eingabe eines Masterpassworts zu- 


Gesetzt den Fall, dass man von einem Schlüssel der Länge 3 ausgeht, kann der Text (genü- 
gend Zeichen vorausgesetzt) in mehrere Teile mit gleicher Zuordnung von Geheimtext- zu 
Klartextbuchstaben zerlegt (rot, blau und schwarz in obiger Grafik) und mit drei voneinan- 
der unabhängigen Häufigkeitsanalysen entschlüsselt werden. Verschlüsseln Sie einen län- 
geren Text und probieren Sie das Kasiski-Verfahren aus. Liefert das Verfahren stets die rich- 
tige Schlüssellänge? Begründen Sie Ihre Antwort. 

d Ist der Schlüssel mindestens so lang wie der zu verschlüsselnde Klartext, so spricht man 
von einem One-Time-Pad. Lässt sich auch das One-Time-Pad mit dem Kasiski-Verfahren 
knacken? Geben Sie eine begründete Antwort. 


4 Zugriff von Staatsseite: Key-Escrow 


Von >Key-Escrow spricht man dann, wenn der geheime Schlüssel bei einem unabhängigen 
Dritten hinterlegt wurde und staatliche Stellen bei Vorliegen festgelegter Voraussetzungen 
Zugriff aufdie Schlüssel erhalten und so die Verschlüsselung aufheben können. Eine Regierung 
möchte Key-Escrow bei der Verschlüsselung von Messenger-Apps vorschreiben. Beziehen Sie 
Stellung zu diesem Vorhaben. 


> Key-Escrow lässt 
sich mit Schlüssel- 
hinterlegung 
übersetzen 
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8 Ri 3- = 5 Skytale 8 Cäsar-Verschlüsselung implementieren & 
Die griechische Stadt Sparta verwendete Im Lehrtext haben Sie die Cäsar-Verschlüsselung kennengelernt. In dieser Aufgabe werden Sie 
> Skytale von zur Kommunikation sog. >Skytale. Eine diese nun implementieren. 
altgriechisch Skytale ist ein einfacher Holzstab, auf a Ein wichtiger Bestandteil der Cäsar-Verschlüsselung ist das Verschieben innerhalb des Al- 
„orurän“ =,Stab“ den die auf einen Lederstreifen nieder- phabets. Implementieren Sie eine Methode verschiebe(buchstabe, abstand), die einen ge- 
geschriebene Nachricht zurVer- undEEnt- gebenen Buchstaben buchstabe um abstand verschiebt. Achten Sie dabei darauf, dass 
schlüsselung wie im Bild gezeigt aufge- _ Beispieleiner Skytale der Abstand auch negativ sein kann, wenn im Alphabet rückwärts verschoben werden 
rollt wird. Sender und Empfänger benötigten lediglich einen Holzstab mit demselben soll. Informieren Sie sich dazu für Ihre Programmiersprache, wie Sie Buchstaben in Zahlen 
> Transpositionsver- Durchmesser, um mithilfe von Skytalen zu kommunizieren. (und umgekehrt) umwandeln. 
fahren von lateinisch a Erläutern Sie, welche Information bei diesem Verfahren den Schlüssel darstellt. b Nutzen Sie die in a) entwickelte Methode und implementieren Sie eine Methode 
en b Bauen Sie selbst eine Skytale und ver- und entschlüsseln Sie damit Nachrichten. verschiebeSatz(satz, abstand), um jeden Buchstaben eines Satzes um einen festgelegten 
= c Bei den Skytalen handelt es sich um ein sog. >Transpositionsverfahren. Erläutern Sie (und Abstand zu verschieben. 
BR recherchieren Sie ggf.), inwiefern sich das Verfahren von der Cäsarverschlüsselung - ei- c Ver- und Entschlüsseln ist nun lediglich das Vor- bzw. Zurückschieben des Satzes um ei- 
> Substitutionsver- Sen tg : EN 5 R Een R . al 
fuhren von Istäinlsch nem >Substitutionsverfahren - unterscheidet. Berücksichtigen Sie dabei auch mögliche nen gegebenen Abstand. Verwenden Sie Ihre Implementierung aus b), um je eine Metho- 
substituere= Angriffsverfahren (Häufigkeitsanalyse, Brute Force, ...). de zum Ent- und Verschlüsseln umzusetzen. 
„ersetzen” 
ii RR) 6 Eine eigene Verschlüsselung entwickeln Brute-Force-Angriff auf die Cäsar-Verschlüsselung A & 
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Entwickeln Sie ein eigenes Verschlüsselungsverfahren. Setzen Sie es ein, um sich gegenseitig 
verschlüsselte Nachrichten zu schicken. Beurteilen Sie anschließend, inwiefern Ihr Verfahren 
anfällig für eine Häufigkeitsanalyse und einen Brute-Force-Angriff ist. 


Manche Daten sind schützenswerter als andere 

Die Anzahl möglicher Schlüssel bestimmt, wie leicht ein Schlüssel durch Ausprobieren erraten 

werden kann. Bei nur wenigen möglichen Schlüsseln benötigen schnelle Rechner nur wenige 

Sekunden. Um ein unbefugtes Dechiffrieren möglichst lange zu verhindern, müssen also be- 

sonders viele Schlüssel möglich sein. Das wiederum erhöht oft den Rechenaufwand. 

a Bestimmen Sie, wie viele verschiedene Schlüssel möglich sind bei einer Auswahl aus 26 
Zeichen (z. B. Alphabet in Klein- oder Großbuchstaben) und unterschiedlichen Passwort- 
längen von 6, 10 bzw. 20 Zeichen. Bestimmen Sie auch, wie lange ein Computer jeweils 
zum Ausprobieren aller möglichen Schlüssel benötigt, wenn pro Sekunde 10.000 bzw. 
500.000 Schlüssel ausprobiert werden können. 

b Manche Informationen müssen nur für wenige Stunden, andere für Jahre geschützt wer- 
den; wie lange, hängt von der Relevanz der Daten ab. Ordnen Sie die folgenden Daten 
nach ihrem Schutzbedarf und begründen Sie Ihre gewählte Reihenfolge. 

» Geheimdienstinformationen 

» getätigte Banküberweisungen des heutigen Tags 

» persönliche Patientenakte 

« Aufstellung für das Fußballspiel am Wochenende 
Kreditkarteninformationen im Onlineshopping 
Chatnachrichten mit dem besten Freund/der besten Freundin 


In dieser Aufgabe implementieren Sie selbst einen Brute-Force-Angriff, beidem man versucht, 

den Schlüssel durch Ausprobieren aller Möglichkeiten zu ermitteln. 

a Implementieren Sie eine Methode, die alle möglichen Schlüssel für die Cäsar-Verschlüsse- 
lung ausprobiert und die resultierenden Klartexte in einer Liste zurückgibt. In der Vorlage 
findet sich bereits eine Implementierung von Methoden zur Ver- und Entschlüsselung, 

Sie können aber auch eine eigene verwenden, wenn Sie bereits eine solche entworfen 
haben. 

b Die Suche nach dem Schlüssel könnte bereits abgebrochen werden, wenn die Entschlüs- 
selung einen sinnvollen Klartext liefert. Ergänzen Sie Ihre Methode aus a) um eine Ab- 
bruchbedingung, die lediglich den richtigen Klartext zurückgibt. Dabei können Sie davon 
ausgehen, dass der Text mindestens einen der folgenden Ausdrücke beinhaltet:,Guten 
Tag‘, „Hi“, „Hallo“, „Grüße“, „Servus“. 

c Bei der Cäsar-Verschlüsselung werden die Buchstaben des Geheimtextes gegenüber dem 
Klartextalphabet verschoben. Damit ergeben sich je nach Zeichensatz beispielsweise 26 
(nur Großbuchstaben) oder 128 (7 Bit ASCII) verschiedene Möglichkeiten. Es ist auch mög- 
lich, jedem Klartextbuchstaben einen beliebigen anderen (noch nicht vergebenen) Ge- 
heimtextbuchstaben zuzuordnen, z. B.: 


Klartextbuchstabe A B [® | D E F G H Pen 
Bee c |x |v Im |n |) Ja Ir |.. 


Berechnen Sie, wie viele mögliche Schlüssel sich dann ergeben, wenn jedem Klartextbuch- 
staben ein beliebiger Geheimtextbuchstabe zugeordnet wird im Falle, dass nur Großbuch- 
staben bzw. alle 7-Bit-ASCII-Zeichen verwendet werden. 

d Implementieren Sie eine Methode, die auch eine solche beliebige Zuordnung durch einen 
Brute-Force-Angriff knacken kann. Nutzen Sie dieselbe Abbruchbedingung wie in 
Aufgabe b). 

e Implementieren Sie eine Methode, die die Buchstabenhäufigkeiten im Geheimtext zählt, 
und nutzen Sie das Diagramm auf 5. 61, um mit Ihrer Methode daraus den Schlüssel zu re- 
konstruieren. 

f Für Schnelle: Vergleichen Sie die Laufzeit Ihrer Methoden aus d) und e). 
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Die Namen 

Alice, Bob und 
Eve werden oft bei 
Erklärungen in 
der Kryptographie 
verwendet. 

Die Rollen von 
Alice und Bob 
sind Sender und 
Empfänger. Eve 
versucht als 
Lauscherin (engl. 
eavesdropper) die 
ausgetauschten 
Nachrichten 
mitzuhören. 


AR e 
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2.4 Zwei Schlüssel: Asymmetrisch verschlüsselte Nachrichten 


Bob hat Alice angekündigt, ihr ein streng 
vertrauliches Paket zu schicken. Aller- 
dings befürchten die beiden, dass die ei- 
fersüchtige Eve versuchen wird, das Paket 
abzufangen und zu öffnen. Daher haben 
sie vorab ein Konzept ausgeklügelt, wie 
Bobs Paket so an Alice versendet werden 
kann, dass es vor Eve sicher ist und nur 
Alice es öffnen kann. Für die Umsetzung 
stehen den beiden jeweils genau die dar- 
gestellten Gegenstände zur Verfügung. 
Beschreiben Sie zu zweit eine Abfolge von Schritten, die einen sicheren Versand ermöglicht. 
Für Schnelle: Reflektieren Sie Ihren Ablauf noch einmal kritisch und überlegen Sie, welchen 
Angriffspunkt er für Eve noch bietet. 


Das Schlüsselverteilungsproblem 

Ein zentraler Nachteil der symmetrischen Verschlüsselung von Nachrichten liegt auf der Hand: 
Selbst, wenn ein Verfahren verwendet wird, das bewiesenermaßen nicht zu knacken ist, steht und 
fällt die Sicherheit derKommunikation mit der Geheimhaltung des Schlüssels.Wird dieser bekannt, 
können alle Botschaften, die damit verschlüsselt wurden, entschlüsselt und gelesen werden. 
Möchte Bob eine verschlüsselte Mitteilung an Alice schicken, dann muss ein gemeinsam verwen- 
deter Schlüssel vorab ausgetauscht werden. Gerade bei der Kommunikation über das Internet 
ist das problematisch, denn dabei könnten Angreifer wie Eve versuchen, den im Klartext über- 
tragenen Schlüssel heimlich abzufangen. Diese Problematik heißt Schlüsselverteilungsproblem. 


Lösungskonzept: Zwei Schlüssel statt einem 

Um das Problem zu lösen, wurde das Konzept der asymmetrischen Verschlüsselung entwickelt. 
Dabei verfügen alle, die wie Alice eine Nachricht empfangen wollen, über zwei verschiedene 
Schlüssel: einen öffentlichen Schlüssel, den andere zum Verschlüsseln einer Nachricht an Alice 
benutzen können, und einen privaten Schlüssel, den nur Alice selbst hat und der zum Entschlüs- 
seln dient. Ihren öffentlichen Schlüssel macht Alice überall bekannt. Man kann ihn sich als ein 
geöffnetes Vorhängeschloss vorstellen, das man nur noch zuschnappen lassen muss; Kopien 
dieses Schlosses kann man auf jedem Postamt erhalten und damit Nachrichten an Alice verschlie- 
ßen. Den Schlüssel, mit dem das Schloss wieder geöffnet werden kann (privater Schlüssel), hat 
aber nur Alice selbst. 


a 


Ärgerlich, ohne richtigen Nur ich habe den passenden 


Mit einem „Alice-Schloss* 


verschließen, bitte! A Schlüssel dauert das Öffnen || schlüssel für all meine 
Mia zu Ienge= „Alice-Schlösser‘ 


2.4 Zwei Schlüssel: Asymmetrisch verschlüsselte Nachrichten 


Umsetzung des Lösungskonzepts mit zwei Schlüsseln 

Um Nachrichten nach diesem Konzept zu übermitteln, sind mathematische Funktionen und zwei 

digitale Schlüssel (Zeichenketten) nötig. Verschlüsselt Bob eine Nachricht an Alice mit ihrem (primzahlmulti- 
öffentlichen Schlüssel, dann darf Eve die Verschlüsselung beim Abfangen der Nachricht nicht | plikation ist eine 
rückgängig machen können. Für die Kriterien einer (allgemein bekannten!) Verschlüsselungs- Einwegfunktion: 


i i 31: 89 zu berech- 
funktion heißt das: nen ist dndach, die 


1 Verschlüsselung des Eingabewerts mit geringem Aufwand Teiler von 2759 zu 
2 extrem großer Aufwand für den Rückschluss von Ausgabe- auf Eingabewert, £ > ist aber 
auch wenn Funktionsvorschriften und öffentlicher Schlüssel bekannt sind 8) aufwändig 

3 Umkehrfunktion zum einfachen Entschlüsseln der Nachricht funktioniert nur mit NV 


dem privaten Schlüssel 
Die ersten beiden Anforderungen erfüllt eine sog. Einwegfunktion - die einfache Berechnung 
geht nur in eine Richtung (auf „einem Weg“). Gibt es zusätzlich einen schnellen Weg für die Um- 
kehrung (Anforderung 3), wird sie Falltürfunktion genannt. 


Alice' öffentlicher Schlüssel Fe a an 


aber Rauskommen ist 
Ich besorge mir Alice‘ ‚ohne meinen Schlüssel 
geheime öffentlichen Schlüssel fast unmöglich) 
und speise ihn zusammen 
Botschaft mit meiner Nachricht 
im Klartext in die Falltürfunktion 


meines Programms ein. 
Falltür- ...et voilä! 

funktion 
(öffentlich 


bekannt) 


geheime 
Botschaft 
verschlüsselt 


Nur ich habe den geheimen 
Schlüssel zum Entschlüsseln, 
ohne den ist es so gut wie 
unmöglich! Ich speise ihn 
mit der verschlüsselten 
Nachricht in das gleiche 
Programm ein; das verwendet 
nun die allgemein bekannte 
Umkehrfunktion. 


Alice' privater 
Schlüssel 


Umkehrung der 
Falltürfunktion 
(öffentlich 
bekannt) 
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>RSA steht fürdie *RSA 


Die Funktionen arbeiten mit Zahlen, nicht mit Zeichen: Die Zeichen der Botschaften und der 


Schlüssel werden vor der Verarbeitung durch Zahlen codiert. 
Der RSA-Algorithmus 
wird ausführlich in 


; idee union Aufgabe 8 behandelt. @ 
Namen der dreiEr- Das wohl bekannteste Beispiel für die Umsetzung des asym- Q 
ee metrischen Verschlüsselungsprinzips ist das >RSA-Verfah- \I 
“ ren: Dessen Falltürfunktion basiert darauf, dass es zwar leicht möglich ist, zwei 


Meine privaten 


Dateien verschlüssele| Algorithmus dafür gibt, eine Zahl wieder in ihre Primfaktoren zu zerlegen. 


ich aber lieber 
symmetrisch. Das ist 


(sehr große) Primzahlen miteinander zu multiplizieren, es aber keinen effizienten | 


unkomplizierter, weil 


ich dafür nur einen 


Schlüssel brauche! 
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Für eine asymmetrische Verschlüsselung benötigt der Empfänger von Nachrichten ein 
zusammengehöriges Schlüsselpaar: 

Bei der Verschlüsselung erzeugt eine Falltürfunktion aus einem Klartext und dem öffentli- 
chen Schlüssel des Empfängers einen Geheimtext. 

Bei der Entschlüsselung erzeugt die Umkehrung der Falltürfunktion aus dem Geheimtext 
und dem geheimen Schlüssel des Empfängers wieder den Klartext. 


Aufgaben 


8 OÖ 1 Richtig oder falsch 

Entscheiden Sie, ob die Aussagen wahr oder falsch sind, und berichtigen Sie falsche Aussagen. 

a Wenn ich eine asymmetrisch verschlüsselte Nachricht verschicken möchte, dann ver- 
schlüssele ich sie mit meinem öffentlichen Schlüssel. 

b Die Funktion „Quersumme bilden“ ist eine Falltürfunktion. 

c Wenn man sich das Konzept der asymmetrischen Verschlüsselung vorstellt, ist der öffent- 
liche Schlüssel ein Vorhängeschloss, das man mit dem privaten Schlüssel zusperrt. 

d Zum Entschlüsseln einer erhaltenen Nachricht benötige ich die Umkehrung der Falltür- 
funktion mit der verschlüsselten Nachricht und meinem privaten Schlüssel als Eingabe- 
werten. 


ap) 2 Symmetrische vs. asymmetrische Verschlüsselung 

a Recherchieren Sie drei Vorteile asymmetrischer Verschlüsselung gegenüber einer symme- 
trischen Verschlüsselung und formulieren Sie sie kurz aus. 

b Recherchieren Sie drei Nachteile der asymmetrischen Verschlüsselung gegenüber der 
symmetrischen Verschlüsselung und formulieren Sie auch diese kurz aus. 

c Die Länge (und damit Sicherheit) eines Schlüssels wird in der Regel in Bits angegeben. 
Für einen 128 Bit-Schlüssel existieren also verschiedene Möglichkeiten. Recherchieren Sie, 
wie viele Bits aktuell für Schlüssel beim asymmetrischen Verschlüsselungsverfahren RSA 
empfohlen werden und wie es sich beim symmetrischen AES-Verfahren verhält. 


2.4 Zwei Schlüssel: Asymmetrisch verschlüsselte Nachrichten 


3 In der Gruppe kommunizieren 
Tomasz, Sophie, Jelka, Emma und Torben wollen untereinander geheime Nachrichten austau- 
schen. Dazu wollen sie zunächst eine symmetrische Verschlüsselung verwenden. Sie haben 
sich mehrere Schlüssel angelegt und wie in der Grafik dargestellt untereinander verteilt. 

a Kann Sophie eine Nachricht an Torben 
schicken, ohne dass jemand anderes als 
die fünf die Nachricht mitlesen kann? 
Begründen Sie Ihre Antwort. 

b Wie viele zusätzliche Schlüssel werden bei 
Verwendung der symmetrischen Ver- 


schlüsselung benötigt, damit jeder jedem © 
anderen eine geheime private Nachricht N © = & N 
schicken kann? Begründen Sie Ihre Ant- Tanasz © © _jelka 
wort. 

c Nachdem die fünf das System unter sich 
getestet haben, wollen sie der ganzen he) [&' ne} 
Klasse Zugriff auf ihr System geben. Wie © & =) Be} 


viele Schlüssel brauchen sie insgesamt, N N 


wenn sie 15 weitere Mitschülerinnen und 
Mitschüler haben? Begründen Sie Ihre 
Antwort. (Tipp: Überlegen Sie zunächst, 
wie viele Schlüssel für jede weitere Person hinzukommen.) 

Tomasz schlägt vor, anstelle der symmetrischen Verschlüsselung ein asymmetrisches Verfah- 

ren zu nutzen. 

d Erklären Sie im Beispiel knapp, welchen Vorteil er sich davon verspricht und welche Nach- 
teile damit einhergehen. 


4 Einweg- und Falltürfunktionen 
a Beschreiben Sie, ob bzw. inwiefern die folgenden Vorgänge mit Einweg- oder Falltürfunk- 
tionen verglichen werden können. 

i Erbsen und Linsen mischen 

ii flüssige Farben mischen 

iii Sand und Kies mischen 

iv schriftliches Quadrieren einer großen Zahl 

b Erläutern Sie knapp, inwiefern ... 

* ... ein gedrucktes Telefonbuch als 
Metapher für eine Einwegfunktion 1010 
betrachtet werden kann. inder, A. ee 
... der abgebildete Briefkasten als 
Metapher für eine Falltürfunktion be- 
trachtet werden kann und was ge- 
schehen muss, damit man ihn als Bild 
für eine Einwegfunktion ansehen 
kann. 

... das abgebildete Straßenschild als Metapher für eine Einweg- bzw. Falltürfunktion 
angesehen werden kann. 


aQ 
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& 5 Sichere E-Mails (Teil 1): Verschlüsselung gemäß OpenPGP 


OpenPGP ist ein gängiger Standard für die Ver- 
schlüsselung von E-Mails. Richten Sie auf Ihrem 
privaten Rechner bei Ihrem Webmail-Dienst im 
Browser für Ihre E-Mail-Adresse eine Verschlüsse- 
lung nach dem OpenPGP-Standard ein. Recher- 
chieren Sie ggf. online. Die folgenden Schritte ge- 
ben Ihnen dabei Orientierung: 
1 Verschlüsselungssoftware als Browser-Add- 
on installieren 


OpenPGP verschlüsselt nicht die ganze 
Nachricht asymmetrisch, das wäre zu 
rechenintensiv. Stattdessen wird hybride 
Verschlüsselung eingesetzt: Die Nachricht 
wird symmetrisch verschlüsselt mit einem 
dafür zufällig erzeugten Schlüssel. Dann 
wird nur dieser Schlüssel asymmetrisch 


verschlüsselt. 
N 


2 Schlüsselpaar erstellen, privaten Schlüssel durch zusätzliche Passphrase 


schützen 


3 öffentliche Schlüssel auf einem sicheren Kanal austauschen und in den | | 


Schlüsselbund der Software importieren 
4 verschlüsselte E-Mails schreiben 


X Q 6 Symmetrisch + Asymmetrisch = Hybrid 


Asymmetrische Verschlüsselungsverfahren arbeiten deutlich langsamer als symmetrische, 
bringen aber den Vorteil mit, dass ein Schlüsselaustausch nicht nötig ist. Daher wird in der 
Praxis, z. B. bei der Verschlüsselung von E-Mails, oft eine hybride Verschlüsselung eingesetzt, 


die die beiden Vorteile vereint. 


Im Folgenden sind die einzelnen Schritte beim Versenden einer Nachricht notiert, allerdings 


in falscher Reihenfolge: 
1 Nachricht symmetrisch verschlüsseln 


2.4 Zwei Schlüssel: Asymmetrisch verschlüsselte Nachrichten 


Auf einer Kopie des Graphen berechne ich für 


2 symmetrischen Schlüssel für diese eine Anwendung zufällig erzeugen 
3 verschlüsselte Nachricht und verschlüsselten Schlüssel versenden 
4 symmetrischen Schlüssel mit öffentlichem Schlüssel des Empfängers verschlüsseln 


a Diskutieren Sie zu zweit und geben Sie die Schritte in der richtigen Reihenfolge an; be- 


gründen Sie, inwiefern die genannten Vorteile vereint werden. 


Ich nehme Bobs öffentlichen Graphen und 
beschrifte alle Knoten so mit beliebigen ganzen jeden Knoten die Summe aus allen Zahlen 


Zahlen, dass deren Summe die Zahl ergibt, die seiner direkt benachbar-ten Knoten und seiner 
ich übermitteln möchte. eigenen Zahl. Das Ergebnis notiere ich an 
‚jedem Knoten. 


DEREN 
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Nur den Graphen mit den 
Summen übermittle ich an Bob. 


Sn 
Ich ziehe meinen privaten Graphen zu Rate und addiere a‘ 
nur die Zahlen an den markierten Knoten. Schon habe 


ich die übermittelte Nachricht entschlüsselt! 


b Um die Funktionsweise des Verfahrens nachzuvollziehen, muss man eine Besonderheit 
des Graphen erkennen: Jeder nicht markierte Knoten ist direk- 
ter Nachbar von genau einem markierten Knoten. Die entstan- 
denen Teile überschneiden sich nicht. 

Begründen Sie, weshalb Bob deshalb nur die drei Zahlen der mar- 
kierten Knoten addieren muss. Begründen Sie außerdem, wes- 
halb die Kenntnis der Besonderheit des Graphen nicht genügt, 


er) 
72081 
3AF 


um das Geheimnis von Alice und Bob zu lüften. Sie können dazu 
am bereitgestellten Graphen experimentieren. 


b Formulieren Sie den Ablauf auf Empfängerseite. 


c) s- 7 Die Antwort auf alle Fragen c Entwickeln Sie einen eigenen Verschlüsselungsgraphen und lassen Sie sich mit dessen 
Alice möchte Bob eine streng geheime Zahl übermitteln, die die,Frage nach dem Leben, dem Hilfe eine streng geheime Botschaft übermitteln. 
& Universum und allem“ beantwortet. Alice und Bob verwenden dafür einen Graphen. (Tipp: Beginnen Sie mit den markierten Knoten und deren Nachbarn und verbinden Sie 


anschließend Nachbarn - aber nicht markierte Knoten - beliebig untereinander.) 


r a ; 
8 Der RSA Algorithmus . m . . Die Modulo-Rechnung wird OD a 19) 
Um die Schritte des RSA-Algorithmus ausführen zu können, ist auch „Uhren-Arfchmetik“ 


die Kenntnis zweier Rechentechniken notwendig. Diese werden genannt, da man sie teils + 
in den Teilaufgaben a) und b) thematisiert. bei der Angabe gewisser 


ö i Uhrzeiten (unbi t 
BObSORERNIChENSEaph a Modulo-Rechnung: Durch die Modulo-Operation wird der a u 


Bobs privater Graph mit markierten Knoten 


anwendet. 

a Vollziehen Sie das Verschlüsselungsverfahren nach, indem Sie zu zweit die Beschreibun- Rest der ganzzahligen Division bestimmt, beispielsweise gilt Sx {SS 
gen von Alice und Bob für die Zahl 42 auf den bereitgestellten Graphen ausführen. Es ist 33 mod 15=3oder8mod2=0. S 
bei dieser Aufgabe sehr wichtig, dass Sie gewissenhaft und genau arbeiten, denn ein ein- Geben Sie die Ergebnisse der folgenden Ausdrücke an und erklären 
ziger Rechenfehler macht eine anschließende Entschlüsselung unmöglich. Sie am Beispiel, was die Figur meint. 

17 mod 9 174 mod 25 100 mod 1 20 mod 20 | 
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b=1: 
(11-1)mod4=3X 
b=2: 
(11-2) mod4=2X 
b=3: 
(11-3) mod 4=1 
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b Multiplikatives Inverses modulo m: Um einen passenden Wert für b in einer Gleichung 
der Form (11: b) mod 4 = 1 zu finden, setzt man üblicherweise den sog. erweiterten Eukli- 
dischen Algorithmus ein. Zum Nachvollziehen des Algorithmus mit kleinen Zahlen ge- 
nügt es aber, wie die Figur systematisch auszuprobieren. 

Finden Sie jeweils ein multiplikatives Inverses der folgenden Ausdrücke: 

(16-b)mod3=2 (14-b)mod5=0 (27:b)mod6=4 

Die einzelnen Schritte des RSA-Algorithmus sind im Folgenden dargestellt. Vollziehen Sie 
den Algorithmus zu zweit nach, indem Sie ein Zeichen (repräsentiert durch eine Zahl) erst 
ver- und dann wieder entschlüsseln. 

Tipp: Wählen Sie kleine Werte für p, q und a! 


n 


« Ich wähle zwei beliebige Primzahlen p und q. 

« Deren Produkt nenne ich n. 

+ Ich berechne m als (p-1) - (q-1). 

« Ich wähle a teilerfremd zu m (also z.B. eine 
Primzahl, die m nicht teilt). 

« nunda veröffentliche ich als meinen 
öffentlichen Schlüssel. « Diese „Klarzahl” verschlüssele ich 

/, * Nun bestimme ich das multiplikative unter Verwendung yon Alice’ 

Inverse b: öffentlichem Schlüssel mit der 

Falltürfunktion: 
Geheimzahl = (Klarzahl°) modn N 

« Die Geheimzahl übermittle ich 
an Alice, 


« Meinem geheimen Zeichen, das 
ich an Alice schicken möchte, 
ordne ich durch einen Zeichen- 
code eine feste Zahl zu. 


(a-b)modm=1 
« b und n benötige ich als privaten Schlüssel. 
b muss ich streng geheim halten! 
« (p,q und m werden nicht weiter benötigt, 
dürfen aber auch nicht verraten werden!) 


ul, 


« Eine erhaltene Geheimzahl entschlüssele ich, indem ich sie mit den beiden 
\ Bestandteilen meines privaten Schlüssels in die allgemein bekannte 
Umkehrfunktion einsetze: 
Klarzahl=(Geheimzahl®) mod n 
« Der vereinbarte Zeichencode verrät mir nun das übermittelte Zeichen. 


d Bob hat Alice eine geheime Zahl geschickt. Eve hat die verschlüsselte Zahl 5 abgefangen. 
Zudem ist Alice' öffentlicher Schlüssel (n=35, a=5) bekannt. 

Knacken Sie die Codierung und finden Sie heraus, welche Zahl übermittelt wurde. 

e Für Schnelle: Begründen Sie, warum es keine gute Idee ist, eine Nachricht zeichenweise zu 
verschlüsseln, und überlegen Sie sich Alternativen (recherchieren Sie ggf.). 

f Für ganz Schnelle: Eve fängt eine weitere verschlüsselte Zahl ab: 147. Diese wurde mit 
dem öffentlichen Schlüssel (n=247, a=11) verschlüsselt. Knacken Sie auch hier die Codie- 
rung. Hinweis: Die Bestimmung des multiplikativen Inversen b durch Ausprobieren ist 
nun sehr aufwändig. Nutzen Sie stattdessen den erweiterten Euklidischen Algorithmus. 
Recherchieren Sie dessen Funktionsweise oder nutzen Sie einen Onlinerechner. 
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2.4 Zwei Schlüssel: Asymmetrisch verschlüsselte Nachrichten 


Der Aufwand, RSA zu knacken 

Der RSA-Algorithmus basiert darauf, dass die Suche nach Primfaktoren einer Zahl sehr auf- 
wändig ist. Ein einfacher Algorithmus zum Finden des kleinsten Teilers, bei dem probehalber 
durch die ungeraden Zahlen dividiert wird, ist in der Blocksprache beschrieben: 


findeKleinstenTeiler(zahl) - > GANZZAHL 
obergrenze = rundeAb(zieheWurzel(zahl)) 


zähle nummer von 1 bis obergrenze schritt 1 


zahl modulo nummer == 


rückkehrMit -1 


a Vollziehen Sie die Arbeitsweise des Algorithmus für den Eingabewert 91 nach: Füllen Sie 
dazu für jeden Durchlauf der Wiederholung eine Tabelle mit den Spalten „nummer“ und 
„Bedingung erfüllt” aus. Geben Sie außerdem zu Beginn den Wert von obergrenze und 
am Ende den Rückgabewert an. 

b Setzen Sie den Algorithmus in Ihrer Programmiersprache um. 

c Speichern Sie vor und nach Ausführung des Algorithmus die aktuelle >Systemzeit und 
geben Sie die Differenz als Dauer des Rechenvorgangs aus. 

Testen Sie die Laufzeit des Algorithmus systematisch für die gegebenen Primzahlen, die 
sich jeweils etwa um den Faktor 10 unterscheiden. Stellen Sie in einer übersichtlichen 
Tabelle gegenüber, um welchen Faktor die Laufzeit des Algorithmus jeweils ansteigt. 

d Für Schnelle: Reflektieren Sie, warum es sinnvoll sein kann, statt einer Laufzeitmessung 
die Anzahl von Rechenoperationen zu zählen. 

e Für ganz Schnelle: Recherchieren Sie, wie der Euklidische Algorithmus arbeitet, und set- 
zen Sie ihn ebenfalls um. Vergleichen Sie dann die Laufzeiten Ihrer beiden Algorithmen. 


Referatstipp: Geheime Botschaften 

Lesen Sie „Geheime Botschaften. Die Kunst der Verschlüsselung von der Antike bis in die 
Zeiten des Internet“ von Simon Singh und vertiefen Sie so Ihr Wissen über Kryptographie. 
Möglicherweise können Sie das Buch in der Schulbibliothek ausleihen. Stellen Sie das Buch 
anschließend in einem kurzen Referat vor. 


Forschungsauftrag: Grenzen der Sicherheit 
Recherchieren Sie, was Quantencomputer sind, wie sie prinzipiell funktionieren und inwie- 
weit Sie die Sicherheit von Verschlüsselungsverfahren bedrohen. 


e+rma 


Mit der „Modulo- 
Rechnung“ kann 
man die Teilbar- 
keit überprüfen: 
Wenn der Rest 
einer Division O 
ist, dann ist der 
Divisor ein Teiler 


des Dividenden. 


>Systemzeit: Die Uhr- 
zeit, die im Betriebs- 
system des Computers 
eingestellt ist. 
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ZERTIFIKAT 
Von: grün 


Für: rot 


>von lat. integer, 
unbeschädigt, heil 


>von altgr. 
audevrikög, 
authentikos: richtig, 
zuverlässig 
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Alice ist Schulleiterin des Gymnasiums Infohausen. Sie erzeugt ein Schlüsselpaar für ein 
asymmetrisches Verschlüsselungsverfahren. Den privaten Schlüssel hält sie geheim, den 
öffentlichen Schlüssel macht sie im Internet für alle verfügbar. 

Bob ist Schüler am Gymnasium Infohausen. Eines Nachmittags erhält er eine E-Mail der 

Schulleiterin Alice, dass die Schule aufgrund von Bauarbeiten ab morgen geschlossen blei- 

be. Bob ist misstrauisch und vermutet zunächst, dass sich jemand einen Spaß erlaubt hat 

und die E-Mail nicht wirklich von der Schulleiterin stammt. 

a Bisher ist bekannt, dass Nachrichten mit einem öffentlichen Schlüssel verschlüsselt 
und mit dem zugehörigen privaten Schlüssel entschlüsselt werden können, der öffent- 
liche und der private Schlüssel bilden ein sogenanntes Schlüsselpaar. Bei den meisten 
asymmetrischen Verschlüsselungsverfahren ist es egal, welcher der beiden Schlüssel 
eines Paares zum öffentlichen Schlüssel und welcher zum privaten Schlüssel wird. 
Grundsätzlich gilt: Wird eine Nachricht mit einem Schlüssel des Paares verschlüsselt, 
kann sie nur mit dem anderen Schlüssel des Paares entschlüsselt werden. Dies kann in 
Situationen wie der oben beschriebenen von Nutzen sein. Übernehmen Sie die abge- 
bildete Tabelle auf Papier und ergänzen Sie in den noch leeren Feldern, wer ver- bzw. 
entschlüsseln kann: 


Verschlüsselung einer Nachricht 
mit privatem Schlüssel von Alice. 


Verschlüsselung einer Nachricht mit 
öffentlichem Schlüssel von Alice. 


Wer kann verschlüsseln? 


Wer kann entschlüsseln? 


b Beschreiben Sie basierend auf Teilaufgabe a) ein Verfahren, mit dem Alice beim Ver- 
sand ihrer E-Mails einen „Beweis” beifügen kann, dass die jeweilige E-Mail tatsächlich 
nur von ihr stammen kann und nicht verfälscht worden ist. 


Integritätssicherung schützt gegen Manipulationen 

Bei vielen Kommunikationssituationen, wie z. B. einer Rundmail der Schulleiterin, ist Vertraulich- 
keit nicht das oberste Schutzziel, da die übermittelten Inhalte nicht geheim sind. Wichtiger ist 
hier, die unbemerkte Manipulation einer Nachricht durch Dritte auszuschließen: Nach dem Ver- 
senden könnte die Nachricht der Schulleiterin abgefangen, abgeändert und dann weiterge- 
schicktwerden. AlsIntegritätssicherung bezeichnet maneinVerfahren, welches sicherstellt, dass 
derartige Manipulationen vom Empfänger erkannt werden können, also die >Integrität der 
Nachricht absichert. 


Überprüfung der Authentizität verhindert gefälschte Absenderadressen 
Ein weiteres wichtiges Schutzziel ist die Sicherung 
der >Authentizität einer Nachricht. Damit ist ge- 
meint, dass die Empfänger einer Nachricht überprü- 
fen können, ob die Nachricht tatsächlich vom ange- 
gebenen Absender stammt. Umgekehrt darf der 
Absender oder die Absenderin das Senden einer 
Nachricht im Nachhinein nicht leugnen können. Die 
Nichtabstreitbarkeit ist somit ein eng mit der Au- 
thentizität verknüpftes Schutzziel. 


Ist das wirklich 
von Alice? 


Von: Alice 


| 
Schule fällt diesen 

Monat aus. 
LG, Alice 
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Asymmetrische Verschlüsselung umgekehrt: Digitale Signaturen 

Bei der normalen asymmetrischen Verschlüsselung wird eine Nachricht mit dem öffentlichen 
Schlüssel des Empfängers verschlüsselt; nur dieser kann die Nachricht anschließend erfolgreich 
entschlüsseln. Bei der digitalen Signatur wird dieses Prinzip umgekehrt: Verschlüsselt Alice ihre 
Nachricht mit ihrem geheimen Schlüssel, kann jeder den resultierenden Geheimtext mit ihrem 
öffentlichen Schlüssel entschlüsseln und mit der NachrichtaufÜbereinstimmung prüfen.Sokann 
der Empfänger sichergehen, eine Nachricht von Alice erhalten zu haben, da nur sie im Besitz des 
passenden privaten Schlüssels ist. 


Sender: Empfänger: 
r [verschlüsselt] 
Nachricht MAWSU&4AP@a<3 
Kerala 852h23j8DSj67$#N Mi ; 
s ich schreibe dir diese RAR) öffentlicher 
privater Nachricht, weil ich dir Schlüssel 
sagen wollte, dass... 


S$SD%S#FYHhd#Sd4 
u Pa HGghfS%cCSASGH4f a 


[verschlüsselt] . Pi 
MASSE Nachricht Nachricht 
852h23j8D5j675#N Hallo Bob, Hallo Bob, 
WLKSAD%AYsa%S! ich schreibe dir diese 2 ich schreibe dir diese 
SSDWS#FYHhd#5d4 Nachricht, weil ich dir ° Nachricht, weil ich dir 
HGghf$%cCS4SG#4f sagen wollte, dass... sagen wollte, dass... 


Kryptografische Hashfunktionen ermöglichen kompakte Signaturen 

Um nicht den gesamten Nachrichtentext ver- und entschlüsseln zu müssen, werden bei der di- 
gitalen Signatur in der Regel kryptographische Hashfunktionen eingesetzt. Eine Hashfunktion 
bildet lange Zeichenketten auf kürzere, die sogenannten Hashes ab. Aus einem beliebig langen 
Text wird so ein vergleichsweise kurzer Hashwert. Bei kryptographischen Hashfunktionen han- 
delt essich um eine spezielle Sorte von Hashfunktionen, bei denen es mit vertretbarem Aufwand 
nicht möglich ist, zu einem gegebenen Paar aus Nachricht und dazugehörigem Hashwert einen 
zweiten Eingabetext zu finden, der den gleichen Hashwert produziert. Ein so erzeugter Hashwert 
kann deshalb als „Stellvertreter“ für die Nachricht eingesetzt werden, aus der er erzeugt wurde. 
Somitreichtes, deninderRegel wesentlich kürzeren Hashwerteiner Nachrichtdigitalzusignieren. 


Sender: Empfänger: 
Nachricht 


Hallo Bob, 

ich schreibe dir diese 
Nachricht, weil ich dir 
sagen wollte, dass... 


Nachricht 


Hallo Bob, FR . 
ivatı ich schreibe dir diese öffentlicher 
privater h Nachricht, weil ich dir Schlüssel 
Schlüssel E33 DE sagen wollte, dass... [verschlüsselt] 
j | 675fdSSfSF5sf79Sf# 


R „Tr al 
5 FSISDAFKSADGgds a . 

[verschlüsselt] [HASH 2 [HASH] 

675fdSSISFSSf79SfR FSWSDAFKSADGgds > FSWSDAFKSADGgds 


Durch das Signieren 
des Hashwertes 
müssen weniger 


Daten zum Emp- 
fänger übertragen 
werden, 
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Zertifikate schaffen Vertrauen - auch zwischen Unbekannten Viele Webbrowser beinhalten bereits eine Liste vertrauenswürdiger Zertifizierungsstellen, hier 
Ein verbleibendes Sicherheitsrisiko bei der digitalen Signatur ist die Vertrauenswürdigkeit des etwa der grün dargestellten CA. Wird nun beispielsweise die Webseite A aufgerufen, kann der 
öffentlichen Schlüssels. Beim Nachrichtenaustausch zwischen untereinander bekannten Perso- Webserver seine Kommunikation signieren und neben seinem eigenen Zertifikat auch das Zer- 
nen können die öffentlichen Schlüssel ggf. über einen anderen sicheren Kommunikationskanal tifikat der gelb dargestellten CA mitschicken. Der Browser kann damit die komplette Zertifikats- 
wie z.B. per Brief oder bei einem persönlichen Treffen ausgetauscht werden. Im Internet findet kette (oft engl. Chain of Trust) bis zur grün dargestellten CA überprüfen. Sind alle beteiligten 
aber häufig auch Kommunikation zwischen zuvor unbekannten Kommunikationspartnern statt, Zertifikate (von A, gelb und grün) gültig, kann der Browser der Kommunikation mit dem Web- 
etwa bei der erstmaligen Bestellung in einem Onlineshop. Hier müsste bei jedem erstmaligen server A vertrauen, ohne jemals zuvor mit ihm in Kontakt gestanden zu haben. 


Besuch einer Webseite vorab ein sicherer Austausch der Signaturschlüssel stattfinden. Da dies 
viel zu aufwändig und nicht immer auf sicherem Wege möglich wäre, kommt hier eine hierarchi- 


sche Public-Key-Infrastruktur (PKI) zum Einsatz: Voraussetzung dabei ist, dass alle Kommunikati- Die Integrität, Authentizität und Nichtabstreitbarkeit von Kommunikation kann mittels 

onsteilnehmer dem öffentlichen Schlüssel einer Zertifizierungsstelle (engl. Certificate Authority, digitaler Signaturen abgesichert werden. Häufig werden dabei nicht diekompletten Nach- 

CA) vertrauen. Nur dieser öffentliche Schlüssel muss vorab allen Nachrichtenempfängern be- richten, sondern nur deren Hashwerte signiert, um kürzere Signaturen zu erhalten. Durch 

kannt sein. die Verwendung kryptographischer Hashfunktionen wird dabei die Zugehörigkeit eines 

Hashwertes zu einer bestimmten Nachricht sichergestellt. Die Vertrauenswürdigkeit der 

> von lat. certificare, Auf Antrag stellt die Zertifizierungsstelle elektronische >Zertifikate aus, welche bescheinigen, verwendeten öffentlichen Schlüssel kann dabei über Zertifikate sichergestellt werden, die 
gewiss machen, dass ein öffentlicher Schlüssel zu einem bestimmten Eigentümer gehört. Das Zertifikat wird da- nach erfolgreicher Authentifizierung von einer Zertifizierungsstelle ausgestellt werden. 


beglaubigen ei yon der Zertifizierungsstelle mit ihrem Schlüssel signiert, sodass dessen Integrität und Au- 


thentizität leicht überprüft werden kann. Damit die Zertifizierungsstelle vertrauenswürdig bleibt, 
muss sichergestellt sein, dass sich kein Angreifer ein Zertifikat für einen falschen Namen erschlei- 


chen kann. Deshalb müssen sich alle Antragsteller für ein Zertifikat zunächst bei der Zertifizie- Aufgaben 

rungsstelle authentifizieren, also durch Vorlage geeigneter Dokumente beweisen, dass sie ge- 

nau die Person sind, die sie vorgeben zu sein. 1 Digitale Signaturen bei E-Mails Signatur 8 ° 
Auch beim E-Mail-Versand könnten Integrität (üerschlüsselter 

Die Inhaber eines Zertifikates können ihre Nachrichten signieren und dabei dem Empfänger und Authentizität durch eine digitale Signatur . Hashwert) 

ebenfalls das erhaltene Zertifikat übermitteln. Der Empfänger kann dann mit dem öffentlichen sichergestellt werden. Nachricht 

Schlüssel der Zertifizierungsstelle zunächst die Signatur des Zertifikates prüfen. Anschließend a Beschreiben Sie mögliche Gründe dafür, dass 

lässt sich mit dem im Zertifikat enthaltenen öffentlichen Schlüssel des Absenders die Signatur sich digital signierte E-Mails dennoch bis 

der eigentlichen Nachricht verifizieren. In der unten abgebildeten Grafik ist die Verwendung von heute nicht flächendeckend durchsetzen 

Zertifikaten für die sichere Kommunikation mit Webservern beispielhaft dargestellt. konnten. 


b „Müssten alle E-Mails zwingend digital sig- 
niert sein, gäbe es keine unerwünschten 


© gran eo ein Zertifikat Spammails mehr“ Diskutieren Sie, inwieweit diese Aussage in Ihren Augen zutrifft. 
ICH TE LL P; ür rot aus 
_ N a 2 Sichere E-Mails (Teil 2): Digitale Signatur mit OpenPGP . & 17 8 
I ZERTIFIKAT Diese Aufgabe ist eine Fortsetzung der Aufgabe Sichere E-Mails (Teil 1) in Kapitel 2.4. Das dort 
ZERTIFIKAT Von: grün erzeugte Schlüsselpaar soll nun zur digitalen Signatur einer Nachricht verwendet werden. In 
Von: grün auäcıet der Regel bieten Programme zur E-Mail-Verschlüsselung auch die Möglichkeit, digitale Signa- 
Für: gelb 
@ turen zu erzeugen. 
—— a Signieren Sie mit der in Teil 1 eingerichteten Software eine Nachricht mit Ihrem privaten 
ZERTIFIKAT Schlüssel 
a) L Von: rot " 
ZERTIFIKAT En E57 b Erläutern Sie, weshalb Sie beim Signieren einer Nachricht zur Eingabe eines Passwortes 
Von: gelb aufgefordert werden, beim Verschlüsseln einer Nachricht jedoch nicht. 


Website:D @ 
ee und überprüfen Sie die Signatur der erhaltenen Nachricht auf ihre Gültigkeit. 


— 
ZERTIFIKAT 
Von: blau 
Für: C 


Für: A u —E Von: rot en . a a : ee 
gEMt Website: A N Für: D c Tauschen Sie die signierte Nachricht aus a) mit einem Mitschüler oder einer Mitschülerin 


Website: B Website: C d 
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am? 


aQ* 


Verschiedene Hashfunktionen 

Eine der einfachsten Hashfunktionen arbeitet 
analog zur Bildung einer Quersumme. Hierzu 
wird jedes Zeichen der Nachricht zunächst in 
eine Zahl umgewandelt (z. B. wie beim ASCIl- A 


Code) und diese Zahlen anschließend auf- Zeichen IH fi Jr IN 
AscHcode N 


summiert. 
a Bilden Sie auf diese Weise den Hashwert 
der Nachricht „Bitte signiere mich!“ 
(Tipp: Im Internet gibt es viele Webseiten, | 
welche die Umwandlung von Zeichen in 
ASCII-Codes automatisch erledigen). 
b Entscheiden Sie, ob es sich bei der beschriebenen Hashfunktion um 
i eine Einwegfunktion (vgl. Kapitel 2.4), 
ii eine Falltürfunktion (vgl. Kapitel 2.4), 
iii eine kryptographische Hashfunktion 
handelt, und begründen Sie Ihr Urteil angemessen. 


Digitale Signatur vs. Verschlüsselung 

Diskutieren und bewerten Sie folgende Aussagen: 

a Statt einer digitalen Signatur kann die Integrität einer Nachricht auch durch die normale 
Verschlüsselung der Nachricht mit einem asymmetrischen Verschlüsselungsverfahren ge- 
sichert werden. 

b Statt einer digitalen Signatur kann die Integrität einer Nachricht auch durch die Verschlüs- 
selung der Nachricht mit einem symmetrischen Verschlüsselungsverfahren gesichert 
werden. 


Zertifikate im Webbrowser 
Bei der gesicherten Kommunikation mit 
Webservern kommen Zertifikate zum Ein- 


< [@) Mi) https:// 


satz. a | Zertifikat 
a Lassen Sie sich das Zertifikat für eine 


Webseite im Browser anzeigen. Bei den Allgemein Details Zertifizierungspfad 
meisten Browsern ist dieses Zertifikat 
nach Aufruf der Webseite über ein ] 
Schlosssymbol nahe der Adressleiste er- E) EEE 
reichbar. 

b Ermitteln Sie das Ablaufdatum des Zertifikats und erläutern Sie, weshalb Zertifikate allge- 
mein stets mit einem Ausstellungs- und einem Ablaufdatum versehen sind. 

c Beschreiben Sie mögliche Konsequenzen, falls der private Schlüssel einer CA von Unbe- 
fugten erbeutet würde. 

d Für Schnelle: Recherchieren Sie die Funktionsweise des Online Certificate Status Protocol 
(OCSP) und erläutern Sie, wie es im Fall von Teilaufgabe c) zur Schadensbegrenzung ein- 
gesetzt werden könnte. 


6 Internetfilter in der Schule 


An Ihrer Schule soll ein neuer Jugendschutzfilter installiert werden. 
Dabei werden sämtliche Webseitenaufrufe von Schul-PCs für den 
Unterricht zunächst durch den Jugendschutzfilter geleitet, welcher 
ungeeignete Inhalte blockiert. 

a Nach der Inbetriebnahme des Jugendschutzfilters beschweren 
sich die Schülerinnen und Schüler darüber, dass sie beim Surfen 
im Internet ständig Warnungen über ungültige Zertifikate an- | CJ 
gezeigt bekommen. Erklären Sie, wie es dazu kommt. 

b Der Administrator des Schulnetzes hat neben dem Jugendschutzfilter auch volle Kontrol- 
le über die von den Schülerinnen und Schülern genutzten PCs. Beschreiben Sie, was ge- 
tan werden müsste, damit trotz Filterung des Internetverkehrs keine Zertifikatwarnungen 
mehr angezeigt werden. 


Forschungsauftrag: Weitere Verwendungsmöjglichkeiten für Hashwerte 

Werden auf einer Webseite größere Dateien zum Download ange- 

boten, so wird häufig neben dem Downloadlink auch ein Hashwert 

angegeben. 

a Beschreiben Sie, welchem Zweck die Angabe des Hashwertes 
in diesen Fällen dient. 

b Erläutern Sie, weshalb die Hashwerte bei Downloadangeboten 
in der Regel direkt angegeben werden und nicht wie bei einer 
digitalen Signatur verschlüsselt sind. 

c Formulieren Sie eine Vermutung, weshalb bei kleineren Down- 
loadangeboten häufig auf die Angabe eines Hashwertes ver- 
zichtet wird. 


Projekt1.zip 


Download now! 


Prüfsummen: 
MDS5: 7af949dcfaa486a... 
SHA1: 4ef61fca0b05c73... 


N 


AR 
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Teste dich selbst 


T1 


T2 


2 


T4 


13 


Richtig oder falsch? 

Beurteilen Sie, ob folgende Aussagen richtig oder falsch sind. Begründen Sie Ihre Meinung 

bei falschen Aussagen und geben Sie eine berichtigte Aussage an: 

a Mittels Prüfsummen können viele Übertragungsfehler zwar erkannt, aber nicht korri- 
giert werden. 

b Mit vier Bit lassen sich 2+2+2+2=8 verschiedene Werte darstellen. 

c Der Stellenwert der dritten Stelle des Hexadezimalsystems ist 4096. 

d Während die Cäsar-Verschlüsselung gegenüber Häufigkeitsanalysen anfällig ist, kann ei- 
ne Häufigkeitsanalyse zum Knacken des Vigen&re-Verfahrens nicht eingesetzt werden. 

e Um sicher mit symmetrischen Verschlüsselungen Nachrichten austauschen zu können, 
müssen sich die Beteiligten vorher persönlich getroffen haben. 

f Die Funktion „Quersumme bilden” ist eine Falltürfunktion. 

g Wenn ich eine Nachricht mit asymmetrischer Verschlüsselung verschicken möchte, dann 
verschlüssele ich sie mit meinem öffentlichen Schlüssel. 

h Mittels einer digitalen Signatur kann die Vertraulichkeit einer Nachricht gesichert wer- 
den. 


Cäsar und Vigenere anwenden 

In dieser Aufgabe wenden Sie die Cäsar-Verschlüsselung und das Vigenere-Verfahren an. 

Verwenden Sie dabei nur die 26 Großbuchstaben. 

a Verschlüsseln Sie das Wort „INTERNET“ mithilfe der Cäsar-Verschlüsselung und dem 
Schlüssel k=7. 

b Verschlüsseln Sie den Satz ,ADA LOVELACE WAR INFORMATIKERIN” mithilfe des 
Vigenere-Verfahrens mit dem Schlüssel „ALAN“. Entfernen Sie vorab die Leerzeichen. 


Mögliche Schlüssel 

Bestimmen Sie die Anzahl der möglichen Schlüssel im Vigenere-Verfahren bei Schlüsseln der 
Länge 6, 8 und 10, wenn 26 bzw. 80 verschiedene Zeichen zur Verfügung stehen. Bestimmen 
Sie außerdem, wie lange ein Brute-Force-Angriff für das Durchprobieren aller Möglichkeiten 
benötigen würde, wenn sich 700.000 Schlüssel pro Sekunde ausprobieren lassen. 


Symmetrische und asymmetrische Verschlüsselung 

Stellen Sie die Unterschiede und Einsatzgebiete von asymmetrischer und symmetrischer 
Verschlüsselung gegenüber, indem Sie die folgenden Aspekte betrachten: 

» Anzahl der notwendigen Schlüssel bei Nachrichtenaustausch unter mehreren Personen, 
» notwendige Vorbereitung, um Kommunikation durchführen zu können, und 

« Berechnungsaufwand. 


Digitale Signaturen 

Alice möchte eine Nachricht an Bob schicken. 

Beschreiben Sie, welche Schritte notwendig sind, um den Inhalt der Nachricht mit einer mög- 
lichst kurzen, aber dennoch sicheren Signatur zu versehen, und welche Schritte auf Bobs 
Seite beim Überprüfen der Signatur durchgeführt werden müssen. 


Zusammenfassung 


Um Informationen speichern, verarbeiten 
oder übertragen zu können, muss je nach ver- 
wendetem Medium eine geeignete physische 
Repräsentation der Information geschaffen 
werden. Der Begriff Daten beschreibt in der 
Regel Informationen in einer maschinenlesba- 
ren Repräsentationsform. Der Vorgang des 
Umwandelns einer Repräsentationsform in 
eine andere wird Codieren genannt. Durch 
Prüfsummen können Fehler bei der Daten- 
übertragung oder -speicherung erkannt wer- 
den. 


Informationen, die digital verarbeitet werden 
sollen, werden im Binärsystem codiert. Eine 
kürzere und einfach ins Binärsystem übertrag- 
bare Darstellung der Werte kann mit dem He- 
xadezimalsystem erreicht werden. 

Ein Bit ist die kleinste digitale Informationsein- 
heit und kann zwei Werte darstellen; acht Bit 
bilden ein Byte. 


Verschlüsseln ist das Codieren eines Klartex- 
tes mit Hilfe eines Schlüssels in einen Geheim- 
text, um Informationen geheim zu speichern 
oder zu übertragen. Eine Entschlüsselung ist 
nur mit einem passenden Schlüssel möglich. 
Bei der symmetrischen Verschlüsselung gibt 
es nur einen Schlüssel, mit dem ver- und ent- 
schlüsselt wird. 


was 
Zusammenfassung 3 = 2 


Medium: 
Stimme Schrift auf Papier Melodie 


k 


210999! 


Die gleiche Information - 
oben maschinenlesbar, — 


unten menschenlesbar — ____  _, 


876543) 


codiert. N 
Prüfziffer 
Binär- 1 0 0 1 
zahl: 
Stellen- 2: 2 2: 2 
werte: =8 =4 =2 =1 
10015 168 270.2 r0. 2 re on 
Hex-Zahl: D 2 E 
Stellen- 16? 16' 16° 
werte: =256 =16 =1 
D2E,, = 13-256 + 2-16 + 14-1 = 3374 
symmetrische 
Verschlüsselung 
Verschlüsselung 
B einziger mawsu | 
Schlüssel Be 
Klartext Geheimtext 


Entschlüsselung 
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Um eine Verschlüsselung ohne Kenntnis des 
Schlüssels zu knacken, werden bei einem 
Brute-Force-Angriff so lange verschiedene 
Schlüssel ausprobiert, bis der richtige Schlüs- 
sel gefunden und so der Geheimtext ent- 
schlüsselt wurde. Bei einer Häufigkeitsana- 
Iyse werden Buchstabenhäufigkeiten im 
Geheimtext analysiert, um Rückschlüsse auf 
den Klartext zu gewinnen. 


Für eine asymmetrische Verschlüsselung 
benötigt der Empfänger von Nachrichten ein 
zusammengehöriges Schlüsselpaar: 

Bei der Verschlüsselung erzeugt eine Falltür- 
funktion aus einem Klartext und dem öffent- 
lichen Schlüssel des Empfängers einen Ge- 
heimtext. 

Bei der Entschlüsselung erzeugt die Umkeh- 
rung der Falltürfunktion aus dem Geheim- 
text und dem geheimen Schlüssel des Emp- 
fängers wieder den Klartext. 

Das Knacken der Verschlüsselung ist trotz 
Kenntnis der Funktionen (und des öffentli- 
chen Schlüssels) extrem aufwändig. 


Mittels einer digitalen Signatur kann die In- 
tegrität, Authentizität und Nichtabstreit- 
barkeit einer Nachricht gesichert werden. 
Um eine möglichst kompakte Signatur zu 
erhalten, wird dabei ein krypto-graphisch 
gesicherter Hashwert der Nachricht mit 
dem eigenen privaten Schlüssel verschlüs- 
selt und dem Empfänger zusammen mit der 
Nachricht zugestellt. Auch bei Zertifikaten 
kommt dieses Verfahren zum Einsatz. Nach 
der Authentifizierung bei einer Zertifizie- 
rungsstelle, stellt diese ein Zertifikat aus, 
welches die Identität des Inhabers bestätigt. 
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dauert sehr lange 


kryptographische 


Hashfunktion 


privater Schlüssel 


Nachricht 


Hallo Bob, 


ich schreibe dir diese 
Nachricht, weil ich dir 
sagen wollte, dass. 


Website 


Zum Weiterlesen 


Zum Weiterlesen 


L2 Alan Turing und die Enigma 

Gerade im Krieg ist der geheime Austausch 
von Nachrichten von enormem Interesse für 
alle Parteien. Genauso groß ist aber auch das 
Interesse daran, die Verschlüsselung des Fein- 
des zu knacken und so strategische Vorteile zu 
erlangen. Im zweiten Weltkrieg verwendete 
die deutsche Wehrmacht zur Verschlüsselung 
die sogenannte >Enigma. 


Diese eigentlich schon im Jahre 1918 zum 
Patent angemeldete Erfindung verwendete 
mehrere austauschbare, rotierende Walzen 
(1). Damit wurden Eingaben über die Tastatur 
(3) verschlüsselt. Der Geheimtextbuchstabe 
wurde über Lampen (2) angezeigt. 

Über die Steckverbindungen (4) wurden Erset- 
zungen (Substitutionen) umgesetzt, sodass 
bei aktiver Verbindung der Buchstaben A und 
B eine Ersetzung von A durch B bzw. anders- 
rum vorgenommen wurde. 

Kern der Enigma waren die Walzen, die ihrerseits 26 Kontakte auf der linken und rechten Seite 
hatten und so jedem der 26 Buchstaben einen anderen Buchstaben zuordnen konnten. Ein zu 
verschlüsselndes Zeichen musste alle Walzen nacheinander „durchlaufen“. Auf diese Weise wurde 
das eingegebene Zeichen in mehreren Schritten durch ein Geheimtextzeichen ersetzt. Gleich- 
zeitig drehten sich die Walzen mit jedem eingegebenen Zeichen weiter, wobei die rechte Walze 
sofort, die mittlere Walze nach 26 und die linke Walze nach 676 (26*26) Eingaben rotiert wurde. 
Mithilfe einer zufälligen Auswahl von 3 der 5 insgesamt verfügbaren Walzen und den Stecker- 
verbindungen konnten tagesaktuelle Schlüssel eingestellt werden, die über ein geheimes Code- 
buch allen beteiligten Kommunikationspartnern mitgeteilt und 
täglich um Mitternacht gewechselt wurden. 


Bei der Enigma handelt es sich wie bei derVigen£re-Verschlüsselung 
um ein polyalphabetisches Verschlüsselungsverfahren. Über das 
System aus Walzen und Steckerverbindungen bot sie annähernd 
1,6 - 102° verschiedene Schlüssel. 

Unter enormen Anstrengungen und unter Mitarbeit des englischen 
Mathematikers Alan Turing und Vorarbeiten des polnischen Mathe- 
matikers Marian Rejewski konnten die Alliierten den Code der Enig- 
ma knacken und waren so in der Lage, feindliche Funksprüche zu 
entschlüsseln - ein Vorteil, der unter anderem im U-Boot-Krieg 
enorm wichtig war. 


Dabei nutzten sie eine Schwäche der Enigma, nämlich dass ein Buchstabe im Klartext nie auf 
denselben Buchstaben im Geheimtext abgebildet wurde (aus A wurde also nie A), und die Tat- 
sache, dass die deutsche Marine jeden Tag pünktlich den Wetterbericht durchgab. Da dieser 
immer wieder die gleichen Begriffe enthielt, war ein Anhaltspunkt für die Entschlüsselung 


har! 
bo elı 
3AF 


Griechisch: 


aivıypa (enigma): 
Rätsel 
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gefunden. Um tiefere Einblicke in die Funktionsweise des Verschlüsselungssystems zu erlangen, 
provozierten die Alliierten außerdem zusätzliche Funksprüche, über deren Inhalt sie Kenntnis 
hatten, etwa indem sie Seeminen an bestimmten Stellen platzierten. So konnten sie Klartext und 
Geheimtext gegenüberstellen und Eigenschaften des Verhaltens ableiten. 

Hier kamen verschiedene technische Eigenschaften der Enigma ins Spiel. Aufgrund der Tatsache, 
dass Funksprüche selten sonderlich lang waren, waren beispielsweise durch Rotationen der lin- 
ke Walze hervorgerufene Veränderungen im Schlüssel eher selten. Durch ihr Geschick gelang es 
den Wissenschaftlerinnen und Wissenschaftlern um Alan Turing, die Anzahl der möglichen 
Schlüssel auf circa 1 Million zu reduzieren. Mit ihrem Einsatz schafften sie es, den Krieg früher zu 
beenden und dadurch eine Vielzahl an Menschenleben zu retten. 
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3 Kommunikation in Netzwerken 


Nach diesem Kapitel können Sie ... 


„erklären, wie das Internet aufgebaut ist. 


..den Weg einer Nachricht im Internet im 
Schichtenmodell nachvollziehen. 


„‚Chancen des Internets nutzen und 
Risiken verantwortungsvoll begegnen. 


Daten aufteilen / _ 
zusammenführen 


) 


Schicht 2 


Wegewahl der -{ 
Datenpakete 


kml kml  ell 


physikalische _/pem 
Übertragung Schicht 1 


55 


> LAN: 
local area network 


8-Port Switch 


Der Begriff Netz- 
werk beschreibt eine 
Struktur (z. B. auch 
soziales Netzwerk). 
Das Rechnernetz 
(oft auch nur Netz 
genannt) hingegen 
ist der konkrete 
Zusammenschluss 
von Geräten. 
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3 Kommunikation in Netzwerken 


3.1 Erfolgreich weltweit kommunizieren: Das Internet 


Analysieren Sie einen für Sie normalen Tagesablauf unter folgenden Gesichtspunkten: 

a Notieren Sie die Geräte, mit welchen Sie über den Tag verteilt online sind. 

b Notieren Sie alle Programme/Apps, die Sie mit einer Verbindung zum Internet verwen- 
den. 

c Schätzen Sie die Zeit ab, die Sie online sind, d.h. dass eines Ihrer Geräte mit dem Inter- 
net (via Kabel, WLAN, mobilen Daten, etc.) verbunden ist. 

d Schätzen Sie die Zeit ab, in der Sie aktiv an einem Gerät sind, das online ist. 

Stellen Sie sich nun vor, Sie hätten einen ganzen Tag kein Internet zur Verfügung: 

e Beschreiben Sie die Emotionen, die mit der Vorstellung verbunden sind, keine Verbin- 
dung zum Internet zu haben. 

f Überlegen Sie, welche Handlungen Sie nicht ausführen können. 

qg Geben Sie an, welche Handlungen von f) für Sie „überlebenswichtig” sind, und überle- 
gen Sie, wie Sie diese stattdessen offline ausführen können. 


Struktur des Internets 

Ob bei der Verwendung eines Messengerdienstes, beim 
Streamen eines Films, beim Verwenden von Social Media 
oder bei der Onlinerecherche, stets befindet man sich „im“ 
Internet und nutzt „seine“ Dienste. Aus Sicht der Benutze- 
rinnen und Benutzer wird dazu lediglich ein internetfähiges 
Gerät mit einer bestehenden Verbindung benötigt. 

Oft ist dieses Gerät in ein kleines Netz zu Hause (>LAN) ein- 
gebunden. Ein LAN entsteht, indem mehrere Geräte durch 
einen sogenannten Switch verbunden werden. 


Tablet Notebook 


Drucker 


Verbindet man zwei oder drei Computer, so können diese 
direkt miteinander kommunizieren. Je mehr Geräte jedoch 
beteiligt sind, desto größer wird das Rechnernetz und es 

kann zu großem Aufwand bei der Verbindung der Ge- 

räte oder zu hohen Auslastungen bei der Kommuni- Mit meinem „Router" zu 

kation kommen. Auch die Sicherheit könnte gefähr- Hause meine ich meistens & 
det sein, da unter Umständen die Kommunikation ein Gerät, das neben dem TA 
- : » Router auch einen Switch und 

innerhalb des Netzes mitgehört werden kann. Um WLAN-Access-Point enthält. 

diesen Problemen vorzubeugen, werden lokale Netze 

gebildet. Sie sind über spezielle Vermittlungsrechner | 
(Router) zu größeren Netzen miteinander verbunden. 

Für Privathaushalte und kleinere Unternehmen stellt ein sogenannter Internet Service Pro- 
vider (ISP, oft auch nur Provider oder Internetanbieter genannt) eine Verbindung zwischen 
dem privaten LAN und dem Netz des Providers zur Verfügung. 


Netze anderer Netzbetreiber Internet Service Provider 


3.1 Erfolgreich weltweit kommunizieren: Das Internet 


Eine solche Verbindung ist z.B. über eine Glasfaserleitung, über eine Funkverbindung (insbeson- 
dere bei Mobiltelefonen) oder über bereits bestehende Leitungen für Telefon oder Kabelfernse- 
hen möglich. 


Um alle Geräte im Internet erreichen zu können, ist auch das Netz des Internet Service Providers 
mit anderen Netzen verbunden. Dabei unterscheidet man zwischen verschiedenen Hierarchie- 
stufen: Große Provider (>Tier 1) haben in der Regel weltumspannende Netze. Sie kooperieren 
untereinander, indem sie ihre Netze zusammenschließen. So können sie das gesamte Internet 
erreichen. Mittlere Provider (Tier 2) bezahlen große Provider, um Zugang zu deren Netzen zu 
erhalten. Sie verkaufen ihre so aufgebaute Infrastruktur an kleine Provider (Tier 3), welche Ver- 
bindungen für Endanwender bereitstellen. Auf diese Weise werden viele kleine Netze zu einem 
großen Netz. 


Protokolle definieren Regeln für die Kommunikation 
Das Internet verbindet diverse Geräte (von der smarten Armbanduhr bis zum Supercomputer) 
verschiedenster Hersteller miteinander. Damit all diese Geräte sich gegenseitig „verstehen“ und 
erfolgreich Informationen austauschen können, müssen einheitlich festgelegte Regeln bei der 
Kommunikation eingehalten werden. Eine präzise 
Beschreibung dieser Kommunikationsregeln wird 
Protokoll genannt. 
Typische Bestandteile eines Protokolls sind: 
« Ablaufschema der Kommunikation 
(z. B. wer fängt an), schüttelns, der Reden; die 
« Codierung der zu übertragenden Daten Kleiderordnung; Anredetitel 
(z. B. Ergänzung von Prüfsummen) usw. 
» und Reaktion auf Fehler 
(z. B. bei Verlust eines Teils der Daten). 


In der Diplomatie bedeutet 
Protokoll „diplomatisches 
Zeremoniell bei offiziellen 
Anlässen“, wo das Verhalten 
der Akteure genau festgelegt 


ist: Reihenfolge des Hände- 


Dabei unterscheidet man bei den Kommunikationspartnern oft zwischen zwei Rollen, wie sie 
auch im Alltag häufig vorkommen: 

Ein Pizzaservice verhält sich zunächst passiv und wartet auf eingehende Bestellungen der Kun- 
dinnen und Kunden; er muss während der Öffnungszeiten ständig telefonisch erreichbar sein, 
ruft jedoch selbst in der Regel niemanden an. Bei 

vielen elektronischen Kommunikationsvorgän- Server 

genist diesähnlich, wobei die englischen Rollen- 
bezeichnungen >Server für den Anbieter eines 
Dienstes und >Client für den Nutzer eines 
Dienstes verwendet werden. Da Serverdienste in 
der Regel ständig und für viele Clients erreichbar 
sein sollen, werden sie oft in Rechenzentren 
betrieben, welche besondere Vorkehrungen 
treffen, um eine dauerhafte Erreichbarkeit der 
Server zu garantieren (z. B. Vorhalten eines 
Notstromaggregats). 

Clients können sich dann je nach Bedarf zu ei- 
nem Zeitpunkt ihrer Wahl mitdem gewünschten 
Server verbinden und dessen angebotene 
Dienste in Anspruch nehmen. 


———n 
| infohauende | 


Willkommen! 


Client Client Client 


> engl. tier: Rang 


32.1 


> Server: engl. 
„Diener“, hier im 
Sinne von 
Dienstanbieter 
> Client: engl. 
„Kunde” 
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Ein Webbrowser ist demnach ein spezieller Client, mittels welchem beliebige Webserver kontak- Aufgaben 
tiert werden können, um von dort die Inhalte einer Webseite abzurufen. Die Regeln zum Abrufen 
n Webinhalten werden i h HTTP-Protokoll fi legt, Iches sich Client un BE Erna f 
Das „5“ in HTTPS 2 ı ie Er Gab ANNE oh are . arena i As en “ 1 Kommunikation mit einfachsten Mitteln u © f A 
m Server bei der Kommunikation halten müssen. Da das herkömmliche HTTP-Protokoll jedoch eine s : : " see 
steht für „secure“, u : . FR : ß Nachrichten zwischen Europa und Amerika wurden mehrere Jahrhunderte mit dem Schiff über V) 
; @ unverschlüsselte und damit ungeschützte Kommunikation vorsieht, kommt heutzutage meist . : ER 
also eine ver . : i Sir : Bu eR das Meer und an Land mit Kutschen und Boten transportiert. Eine Übertragungsdauer von 
schlüsselte HTTP- die Protokollvariante HTTPS zum Einsatz. Bei dieser erfolgt die Kommunikation zusätzlich ver- mehreren Wachen wardsheinenmal 
Verbindung. schlüssele ehreren Wochen war dabei normal. 


Heute kann man jederzeit mit einer Videokonferenz (fast) in Echtzeit von Angesicht zu Ange- 

sicht sprechen. Ein erster Meilenstein für den Nachrichtenaustausch zwischen Europa und 

Amerika war Mitte des 19. Jahrhunderts das Verlegen eines Kabels zwischen den beiden Kon- 

tinenten. Damit wurde die Voraussetzung geschaffen, physikalische Signale zu übertragen. 

Seekabel haben auch noch heute eine wichtige Rolle in der interkontinentalen Nachrichten- . u 
u Inspektionsschiff für 
übertragung. Seekabel 

Bauen Sie in einer Kleingruppe selbst mit einfachsten Mitteln (Schnüren, Klangstäben, ...) 

eine physikalische Übertragungsmöglichkeit von Signalen auf. Ziel ist es, damit eine Uhrzeit 

ohne Sichtkontakt zum Empfänger zu übertragen. Hinterfragen Sie folgende Aspekte und 

dokumentieren Sie dazu schriftlich Ihr Vorgehen bzw. Ihre Lösung: 

i Bestandteile des Kommunikationssystems und deren Zweck 

ii Ablauf einer Nachrichtenübertragung 

iii Codierung der Information 

iv Für Schnelle: mögliche Fehlerquellen bei der Übertragung und Reaktionen darauf 


Moderne digitale Endgeräte können aber zumeist nicht nur Webseiten abrufen, sondern auch 

mit einer Vielzahl weiterer Servertypen kommunizieren. Verschiedene Anwendungsfälle haben 

oft auch ganz spezielle Anforderungen hinsichtlich Übertragungssicherheit, akzeptablen Verzö- 

gerungszeiten, anfallender Datenmenge usw. Daher haben sich hier jeweils eigene Protokolle 

etabliert: 

E-Mails können mit entsprechender Clientsoftware über das Simple Mail Transfer Protocol 

(SMTP) verschickt und z. B. über das Post Office Protocol (POP) abgerufen werden. 

Die im Gerät eingestellte Uhrzeit kann mittels des Network Time Protocol (NTP) mit den 

Atomuhren von zentralen Zeitservern synchronisiert werden. 

Videostreams können mittels des Real Time Streaming Protocols (RTSP) übertragen werden. 

Druckaufträge können über das Internet Printing Protocol (IPP) an einen Drucker gesendet 

werden, welcher als Druckerserver agiert. 

> RFC=requestfor Die oben genannten Protokolle (und noch viele weitere) sind in sogenannten >RFCs spezifiziert. 

comment Dies sind frei zugängliche Dokumente, in denen die Bestandteile der Protokolle festgelegt wer- 

> lat. proprius:eigen, den. Vereinzelt gibt es auch Softwarehersteller, deren Programme über >proprietäre, d. h. nicht 
persönlich öffentlich bekannte Protokolle, kommunizieren. Programme anderer Hersteller sind mit dieser 

Software dann in der Regel nicht kompatibel. Die freie Verfügbarkeit der Protokollbeschreibun- 

gen in RFCs erleichtert hingegen die Entwicklung kompatibler Client- und Serverprogramme, 


weshalb sich im Internet fast ausschließlich diese offenen Protokolle durchgesetzt haben. 


Mehrere Geräte können zu Netzen zusammengeschlossen werden. Ein Switch dient darin uuazes (ruft beimiPizzaserviceian) 


als Verbindungselement. Ein Router vermittelt in der Kommunikation zwischen Netzen. Das 
Internet besteht aus der Verbindung von unzähligen kleinen, mittleren und großen Netzen 
zu einem riesigen, weltumspannenden Netz, in dem theoretisch jedes Gerät mit jedem 


2 Das Pizzaprotokoll OD e Q 
a Die beiden folgenden Diagramme zeigen jeweils den Beginn eines Telefonats zwischen 
Alice und dem Pizzaservice „Peppones Pizza“. Beschreiben Sie für jedes der Diagramme, 
weshalb die Pizzabestellung fehlschlägt. 


(ruft beim Pizzaservice an) 


Eee ren 


Peppones Pizzaservice, Hallo! 


Peppones Pizzaservice, Hallo! 
4 — 


Danke! PaöNgd! 


ne ae N SR 


\ > 
anderen Gerät kommunizieren kann. R e m n r ??? Ihre Bestellung bitte! ??? Ihre Bestellungbitte! ı 
Damit Maschinen erfolgreich Informationen austauschen können, müssen die Regeln für ‚+ ‚* i 
die Kommunikation in Protokollen eindeutig festgelegt werden. } Bitte mit extra viel Salami! ! hva2zb de K 
Die Kommunikation zwischen Maschinen erfolgt oftnach dem Client/Server-Prinzip.Dabei F . \ A H ! A H 
En . e lee = e r = ı Welche Pizza möchten Sie denn? ' ' Wie bitte? \ 
initiiert der Client die Kommunikation, während der Server als Dienstanbieter zunächst pas- 4 i + f 
siv auf eingehende Anfragen von Clients wartet. ı Hallo, ich möchte eine Pizza bestellen. : oarzd $s1! R 


h4 


b Zeichnen Sie selbst ein Diagramm, in dem eine erfolgreiche Pizzabestellung dargestellt 
ist. 

c Ein hungriger Außerirdischer vom Planeten Melmac fragt Sie, wie das telefonische Bestel- 
len einer Pizza funktioniert. Formulieren Sie für ihn eine detaillierte Protokolldefinition. 
Diese soll alle notwendigen Kommunikationsschritte und deren vorgesehene Reihenfolge 
beschreiben und auch vorgeben, wie bei unvorhergesehenen Abweichungen von diesem 
Schema vorgegangen werden sollte (z. B. Verbindungsabbruch, unverständliche Antwort, 
USW.). 
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ii G 3 Übersicht über unterschiedliche Protokolle 
Verteilen Sie in der Klasse die unten angegebenen Protokolle. Recherchieren Sie in Zweier- 
teams zu jedem Protokoll den vollständigen Namen und geben Sie den Einsatzzweck in we- 
nigen Sätzen an. Für Schnelle: Notieren Sie sich auch eine Beispielkommunikation, welche auf 
dem jeweiligen Protokoll beruht. 
Stellen Sie Ihre Ergebnisse anschließend in der Klasse vor oder tragen Sie diese in ein von der 
Lehrkraft erstelltes Dokument ein. 
SMTP, POP3, IMAP, HTTP, HTTPS, NTP, RTSP, SSH, ARP, FTP, SFTP, IPP,DHCP, MQTT, LDAP 


[6) & 4 Verbindungsorientiert oder verbindungslos kommunizieren 

Viele Protokolle spezifizieren eine verbindungsorientierte Kommunikation mit einem explizi- 
ten Verbindungsauf- und -abbau vor bzw. nach der eigentlichen Nutzdatenübertragung. Beim 
Telefonieren gehört es beispielsweise zum Protokoll, dass man sich zu Beginn begrüßt, um 
sicherzustellen, dass die Telefonverbindung funktioniert und man die richtige Person erreicht 
hat (Verbindungsaufbau). Ebenso wird gemäß dem Protokoll erwartet, dass man sich vor dem 
Auflegen verabschiedet (Verbindungsabbau). Für andere Kommunikationssituationen kann 
aber auch eine verbindungslose Kommunikation sinnvoll sein, da so der Aufwand des Verbin- 
dungsauf- und -abbaus eingespart wird. 
a Diskutieren Sie jeweils, ob es sich bei den folgenden Beispielen um verbindungsorientier- 

te oder verbindungslose Kommunikation handelt. 

i Fahrscheinkontrolle im Zug iii Unterrichtsstunde in der Schule 

ii Absetzen eines Notrufs iv Lautsprecherdurchsage der Schulleitung 


b Ordnen Sie für die Beispiele aus Teilaufgabe a) den jeweils kommunizierenden Personen/ 
Parteien die Rollen „Client” und „Server“ zu. 


8 3- = 5 ALOHA 


Um verschiedene Forschungsstandorte auf der Inselgruppe Hawaii mit der Universität in Ho- 

nolulu zu verbinden, kam bereits in den 1970er Jahren ein Funk-Computernetz zum Einsatz, 

welches das ALOHA-Protokoll verwendete. Dabei sendeten alle Stationen auf der gleichen 

Frequenz; kam es zu einer Signalkollision, weil mehrere Stationen zufällig gleichzeitig sende- 

ten, so schrieb das ALOHA-Protokoll vor, dass alle Sender für eine zufällige Zeit lang warten 

mussten, bevor sie die Übertragung erneut versuchten. 

a Spielen Sie das ALOHA-Protokoll im Rollenspiel nach. Stellen Sie sich dazu in einer beliebi- 
gen Formation im Klassenzimmer auf. Versuchen Sie nun mit anderen Personen laut zu 
kommunizieren. Wenn zwei Personen gleichzeitig sprechen, müssen beide abbrechen 
und für eine (zufällige) Zeit warten. 

b Erläutern Sie verschiedene Vor- und Nachteile des ALOHA-Protokolls und beschreiben Sie 
Einsatzszenarien, für die das Protokoll gut bzw. schlecht geeignet ist. 

<c Noch heute wird bei der Kommunikation von Mobiltelefonen eine Variante des ALOHA- 
Protokolls verwendet, bei der Übertragungen nur zu einheitlich festgelegten Zeitslots be- 
ginnen und maximal einen Zeitslot lang andauern dürfen („slotted ALOHA). Beschreiben 
Sie den Vorteil dieser zusätzlichen Regeln. 


8 & 6 HTTP Statuscodes 


Das HTTP-Protokoll sieht vor, dass ein Server auf die Anfrage eines Clients unter anderem mit 

einem sogenannten Statuscode antwortet. 

a Verschaffen Sie sich einen Überblick über Abschnitt 6 von RFC 7231 und informieren Sie 
sich über die Bedeutung der Statuscodes 200, 301, 401, 403 und 404. 

b Nennen Sie Statuscodes, die Ihnen beim Surfen im Web bereits begegnet sind. 


3.1 Erfolgreich weltweit kommunizieren: Das Internet 


c Erläutern Sie, wie ein Webbrowser auf eine HTTP-Antwort mit dem Statuscode 200, 301, 
401, 403, oder 404 sinnvollerweise reagieren sollte. 

d Für Schnelle: Recherchieren Sie die Bedeutung des Statuscodes 418 in RFC 2324. Achten 
Sie dabei auch auf das Veröffentlichungsdatum dieses RFCs. 


7 Wireshark: Einführung in die Protokollanalyse & Ir} et 
Das frei verfügbare Programm Wireshark kann verschiedenste Formen elektronischer Kom- 
munikation mitschneiden, speichern und analysieren. Die bereitgestellte Datei 


wireshark_http enthält den Mitschnitt eines Webseitenabrufs mittels HTTP-Protokoll. 

a Öffnen Sie den Mitschnitt und machen Sie sich mit dem Hauptfenster von Wireshark ver- 
traut. Beschreiben Sie kurz die Funktion der oberen und unteren Fensterhälfte. 

b Tippen Sie im Wireshark-Hauptfenster „http“ (ohne Anführungszeichen, gefolgt von der 
Entertaste) in die Anzeigefilterzeile direkt unterhalb der Menüleisten ein, um lediglich 
dem HTTP-Protokoll zugeordnete Datenpakete anzuzeigen. Lösen Sie anschließend 
selbstständig die folgenden Aufgaben: 

i Analysieren Sie die Spalten „Source“ und „Destination“ in der oberen Fensterhälfte und 
finden Sie heraus, hinter welcher Adresse sich der HTTP-Client bzw. -Server verbirgt. 
Begründen Sie Ihre Zuordnung kurz. 

ii Betrachten Sie für die verschiedenen Datenpakete den Abschnitt „Hypertext Transfer 
Protocol” in der unteren Fensterhälfte, um weitere Details einzusehen (hierzu den 
entsprechenden Abschnitt „aufklappen”). Nennen Sie die Datei(en), die der Client 
beim Server anfragt, und beschreiben Sie kurz allgemein, um welche Art von 
Nutzerinteraktion es sich hierbei vermutlich handelt. 

Öffnen Sie parallel in einem zweiten Wireshark-Fenster die Datei wireshark_https, 

vergleichen Sie den Kommunikationsverlauf und beschreiben Sie den wesentlichen 

Unterschied beim Datenaustausch. Beurteilen Sie, inwiefern der Einsatz von HTTPS 

für die gezeigte Nutzerinteraktion sinnvoll erscheint. 


8 Netzneutralität [3] a 
a Recherchieren Sie die Definition des Begriffs „Netzneutralität“. 
b Recherchieren Sie im Internet nach Fällen von Verletzung der Netzneutralität. Finden Sie 
heraus, wie dies von den jeweiligen Befürwortern und Gegnern dargestellt wurde. 
c Diskutieren Sie gemeinsam in Ihrer Klasse: Sollte die Netzneutralität im Internet gesetz- 
lich vorgeschrieben werden? 


9 Rechnernetze simulieren - Teil 1 2 
MitderLernanwendungfiliuskönnen Rechnernetzevirtuellaufgebaut und simuliert werden. 
a Öffnen Sie die Vorlage und analysieren Sie das dargestellte Netz. Geben Sie jeweils an, 
wie viele Geräte, Switches und Router eingesetzt sind. 2 
b Für Schnelle: Erweitern Sie das Netz individuell. 
10 Forschungsauftrag: Tier O 


Beantworten Sie durch eine Recherche folgende Teilaufgaben: 

a Geben Sie jeweils ein Beispiel für einen Tier 1- und Tier 2-Provider in Deutschland an. 

b Erklären Sie den Begriff Peering in Zusammenhang mit Tier 1. 

c Die Verbindung großer Netze erfolgt oft über sogenannte Internetknoten. Geben Sie 
einen Internetknoten für Deutschland an. 

d Viele Internetknoten stellen Statistiken über ihren Datenverkehr online. Vergleichen Sie 
die Statistiken zweier Knoten hinsichtlich Datenmenge, Minima und Maxima der Über- 
tragung. 
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3.2 Aufgaben sinnvoll verteilen: Das Schichtenmodell 


Noch in der ersten Hälfte des 20. Jahrhunderts wurde Fracht auf Schiffen oder Güterzügen 

ausschließlich als Stückgut, d.h. einzeln in Säcken, Netzen, Fässern etc. verladen und trans- 

portiert. Ab den 1960er Jahren begannen sich dann mehr und mehr die heute gängigen 

standardisierten Frachtcontainer durchzusetzen. 

a Erläutern Sie die Vorteile des Containertransports gegenüber dem Transport als 
Stückgut. 

b Oma Erna möchte ihrer Enkelin Amelie zu Weihnachten einen Brief schicken. Da Amelie 
aktuell in Chicago studiert, lässt sich der Weg des Briefes wie folgt darstellen: 


Deutschland: 


Amelie 


Lokale Poststelle 


Brief 
Lokale Poststelle 


Postsack 


Luftpostzentrum 


Luftfrachtcontainer 


Luftpostzentrum 


Beschreiben Sie, welche Elemente des gezeigten Diagramms angepasst werden müss- 
ten, um folgenden Veränderungen gerecht zu werden: 
i Der Transport in die USA erfolgt per Schiff statt per Flugzeug. 
ii Erna schickt eine Postkarte anstelle eines Briefs. 
iii Amelie studiert in Australien. 

c Formulieren Sie eine Vermutung, weshalb sich das in b) dargestellte Verfahren beim 
Brieftransport international durchgesetzt hat. 


Das Diagramm in der Einstiegsaufgabe beschreibt das Kommunikationssystem Post in mehreren 
Schichten (Schichtenstapel). Logisch betrachtet kommuniziert Oma Erna direkt mit Amelie, da 
niemand sonst den Inhalt ihres Briefes liest. Tatsächlich durchläuft der Brief jedoch zunächst den 
Schichtenstapel auf der Absenderseite, wobei auf jeder Schicht eine Umhüllung (Briefumschlag, 
Postsack, Container) hinzugefügt wird. Für den weiteren Transport sind dann nur die Adressin- 
formationen auf diesen Umhüllungen relevant. Für den Transport des Containers muss beispiels- 
weise nur der Zielflughafen, nicht jedoch die Hausnummer des Briefempfängers bekannt sein. 
Auf der Empfängerseite werden diese Umhüllungen dann Schicht für Schicht wieder entfernt, 
bis die ursprünglichen „Nutzdaten“ (der Brief) ihre Empfängerin erreichen. 


Schichten schaffen Flexibilität 

Ein wichtiger Vorteil bei diesem Schichtenmodell ist die einfache Austauschbarkeit der konkre- 
ten Umsetzung einzelner Schichten, ohne dass dafür die übrigen Teile des Systems geändert 
werden müssen. Stellt die Post beispielsweise intern von Postsäcken auf Postkisten um, so hat 
dies keine Auswirkungen für Erna und Amelie oder den Frachtflugverkehr, bei dem weiterhin 


Container transportiert werden. Lediglich die Schnittstellen zwischen zwei aufeinanderfolgen- 
den Schichten müssen einheitlich definiert werden, die internen Abläufe innerhalb einer Schicht 
sind für andere Schichten dann nicht relevant. Erna muss beispielsweise nur das erlaubte Brief- 
format (Schnittstelle zum Postsystem) kennen, aber nichts über die Details des Posttransports 
wissen. Man spricht daher auch von einem „Blackbox“-Modell. 


Das Rad nicht neu erfinden 

Ein weiterer Vorteil ist die Wiederverwendbarkeit bereits existierender Schichten für andere 
Zwecke. Beim Postsystem könnte die Infrastruktur der lokalen Poststellen auch für das Austragen 
von Zeitungen genutzt werden, obwohl die darunterliegende Zulieferstruktur eine andere ist. 
Umgekehrt könnte die vorhandene Luftfrachtinfrastruktur auch für den Transport von Paketen 
genutzt werden, auch wenn auf der darüber liegenden Schicht dann keine Postsäcke zum Einsatz 
kommen. 


Schichten bei der digitalen Kommunikation 

Die Kommunikation zwischen Rechnern kann durch das >TCP/IP-Modell als Stapel aus insge- 
samt vier Schichten dargestellt werden. Wie beim Postbeispiel übernimmt jede Schicht bestimm- 
te Aufgaben, wobei je nach Einsatzzweck verschiedene Protokolle zur Verfügung stehen. Die 
Endnutzer interagieren, ebenfalls 


wie bei der Post, lediglich mit der TCP/IP-Modell Wichtige Protokoll 
obersten Schicht (Anwendungs- un er 


schicht). Diese entspricht in der 


Regel dem jeweils genutzten HERE) SSH NTP 
Dienst (WWW, E-Mail, etc.). Die IMAP ıpp 
dort anfallenden Daten werden SMTP 

dann an die darunter liegenden POP3 
Schichten gegeben, welche je- Rar ...und viele weitere 


weils spezifische Aufgaben über- j 3 
nehmen: ZansR icht 

Die Transportschicht stellt der 

eigentlichen Anwendung einen IP 
Ende-zu-Ende-Kommunikations- 

kanal bereit, sodass die Client- 1000Base-T (Kupferkabel) 
und die Serveranwendung direkt 1000Base-SX/LX (Glasfaserkabel) 
Daten austauschen können. Der IEBE SO2.NN YEunkı 
von der jeweiligen Anwendung 
kommende Datenstrom wird dabei in Segmente aufgeteilt, welche nacheinander übertragen 
werden. Bei >TCP erfolgt die Kommunikation verbindungsorientiert: Vor dem Austausch von 
Nutzdaten wird durch einen sogenannten Handshake zunächst die gegenseitige Erreichbarkeit 
der Kommunikationspartner überprüft. Beim darauf folgenden Datenaustausch wird weiterhin 
dafür Sorge getragen, dass die Segmente auf der Empfangsseite in der richtigen Reihenfolge 
wieder zusammengesetzt werden und ggf. fehlerhaft übertragene Segmente anhand von Prüf- 
summen erkannt und neu angefordert werden. Erst danach wird die Verbindung abgebaut. Um 
all dies zu ermöglichen, müssen bei TCP jedoch viele Steuerungsdaten zusätzlich zu den eigent- 
lichen Nutzdaten übertragen werden. Verwendet man dagegen >UDP, erfolgt die Kommunika- 
tion verbindungslos, das heißt, es findet keine weitere Absicherung der Datenübertragung statt. 
Es ist somit durchaus möglich, dass einige Segmente unterwegs verloren gehen oder den Emp- 
fänger in falscher Reihenfolge erreichen. 


> TCP/IP: Benannt 
nach zwei wichtigen 
Protokollen der 
Transport- bzw. In- 
ternetschicht (auch 
Vermittlungsschicht 
genannt). 


Einige Protokolle 
der Anwendungs- 


schicht werden 
bereits auf Seite 
88 beschrieben. 


H 


> TCP: Transmission 
Control Protocol 


> UDP: User Data- 
gram Protocol 
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Die zentrale Aufgabe der Internetschicht ist die Wegewahl (engl. routing). Insbesondere in gro- Diese Protokollschichtung ermöglicht Flexibilität. Wechselt man beispielsweise von einer Glas- 
ßen Netzen wie dem Internet erreichen die Datensegmente der Transportschicht ihr Ziel in der faserverbindung zu WLAN, muss lediglich das Protokoll der Netzzugangsschicht ausgetauscht 
Regel nicht direkt. Stattdessen werden sie von Vermittlungsrechnern (engl. router) schrittweise werden; die Software der Anwendungsschicht (z.B. Webbrowser) und auch die Implementierun- 
bis ins Zielnetz weitergeleitet. Das Internet Protocol (IP) sorgt dabei dafür, dass die Datenpakete gen der Internet- und Transportschicht müssen dafür nicht verändert werden. 


über verschiedene Wegpunkte ihr Ziel erreichen, auch wenn dieses in einem anderen Netz liegt 
und nur über einen oder mehrere Router erreichbar ist. 


Bei der Modellierung des Informationsaustausches im Schichtenmodell übernimmt jede 


Damit die Datenpakete der Internetschicht von einer Station zur nächs- Schicht eine Teilaufgabe des Kommunikationsprozesses. Die konkrete Umsetzung wird 
ten geleitet werden können, muss ein möglichst störungsfreier Kommu- dann durch schichtspezifische Protokolle festgelegt, welche je nach Anforderungen und 
nikationspfad zwischen diesen Stationen geschaffen werden. Dies ist Rahmenbedingungen untereinander austauschbar und wiederverwendbar sind. 


die Aufgabe der Netzzugangsschicht. Je nach Übertragungsmedium 
müssen verschiedene Arten von Übertragungsfehlern erkannt und ggf. 
der Zugriff auf ein gemeinsames Kommunikationsmedium (z.B. einen gemeinsamen Funkkanal) 
gesteuert werden. Schließlich müssen die als Bitfolge vorliegenden Daten durch ein physisches 


Auf der Anwendungsschicht anfallende Daten durchlaufen den Schichtenstapel auf der 
einen Seite der Kommunikation vertikal nach unten und auf der anderen Seite wieder nach 
oben. Aus logischer Sicht kann so eine direkte Kommunikation auf der Anwendungsschicht 
realisiert werden. 


Bei der Übertra- 
gung mehrerer 
Datensegmente 
kann es vorkom- 


32 Übertragungsmedium (Kabel, Luft, etc.) transportiert werden. Dabei muss durch das verwende- men, dass diese ihr 
te Protokoll unter anderem die Codierung der Daten, aber z. B. bei Kabelverbindungen auch die Wichtige Protokolle der Transportschicht sind TCP und UDP, welche einen verbindungs- ee nr 
Form und Belegung der verwendeten Stecker spezifiziert werden. orientierten (TCP) oder verbindungslosen (UDP) Ende-zu-Ende-Kommunikationskanal be- damit he auehifn 


falscher Reihenfol- 
ge erreichen. 


reitstellen und den Datenstrom der Anwendungsschicht in Segmente unterteilen. 


Auf ihrem Weg vom Sender zum Empfänger durchlaufen die zu versendenden Daten somit stets Aufder Intermetschicht (auch Vermittlungsschicht genannt) kommt in der Regel das Inter- 


ZUnSchEt serukal an SOMERIERstepe aut der? SE Dre KORMENDIE AN net Protocol (IP) zum Einsatz, welches insbesondere die Wegewahl von Datenpaketen in vd N 
daten auf jeder Schicht durch protokollspezifische Adressierungs- und Steuerinformationen, : © : I 
Prüfsummen usw. ergänzt werden. Oft werden diese Zusatzinformationen den eigentlichen ul Jr Sul u u us \1 
> Header: abgeleitet Nutzdaten vorangestellt und deshalb auch als >Protokollheader bezeichnet. Nach der Ankunft Die darunterliegenden Schichten (Netzzugangsschicht bei TCP/IP) übernehmen den ei- 
von engl. head:Kopf beim Empfänger wird der Schichtenstapel dann von unten nach oben durchlaufen und die Nutz- gentlichen Datentransport über ein physisches Medium. Das verwendete Protokoll hängt 
daten schließlich an die Applikation der Anwendungsschicht übergeben. Aus logischer Sicht dabei auch vom verwendeten Medium (Funk, Kabel, ...) ab. | 
kann so beispielsweise ein Webclient direkt mit einem Webserver auf der Anwendungsschicht 
kommunizieren. 
Segmentierung des Datenstroms Aufgaben 
Anwendungs: er Anwendungs- 1 Kommunikationsmedien wu u Ba Si 8 
schicht 4 schicht Maschinen können über diverse Medien miteinander kommunizieren. Gängig ist dabei z. B. 
L_] ‚01001001 01101... kationsfluss 01001001... die Kommunikation über Funksignale oder elektrische Signale (via Kupferkabel). 
| n i E a Nennen Sie möglichst viele weitere denkbare Kommunikationsmedien. 
Transport- E B Transport- b Geben Sie für jedes Kommunikationsmedium aus Teilaufgabe a) die spezifischen Vor- und 
schicht SEEN schicht Nachteile des jeweiligen Mediums an, die für bzw. gegen dessen Verwendung sprechen. 


c Für Schnelle: Informieren Sie sich über das erstmals in RFC 1149 spezifizierte IPOAC-Proto- 

= = koll und bewerten Sie auch das dort genannte Medium analog zu Teilaufgabe b). 

Internet- [Header:... j Header:.. Nutzdaten: Internet- 

schicht 101 San 110101... schicht 2 Wer implementiert was? OK 
Die zentrale Softwarekomponente moderner Endgeräte ist das Betriebssystem (z. B. Windows, © 
MacOS usw.). In der Regel erlaubt dieses die Installation diverser Anwendungsprogramme und 
verwaltet im Hintergrund die Zuteilung gemeinsam genutzter Ressourcen wie etwa Zugriff auf 

den Speicher oder auch an das Kernsystem angeschlossene Zusatzgeräte, wozu auch Schnitt- 
stellenadapter für die Kommunikation in Rechnernetzen gehören. Damit das Betriebssystem 

die vielen verschiedenen erhältlichen Zusatzgeräte steuern kann, stellen die Gerätehersteller 

in der Regel sogenannte „Treibersoftware” bereit. Diese ermöglicht dem Betriebssystem die 
Ansteuerung gerätespezifischer Funktionen über eine einheitliche Schnittstelle. 

a Ordnen Sie die Schichten des TCP/IP-Modells den Bereichen Anwendungssoftware, Be- 
physikalischer Datenstrom triebssystem und Gerätetreiber zu und erklären Sie jeweils, weshalb es sinnvoll ist, die 

über Kommunikationsmedium Protokolle der jeweiligen Schicht dort zu implementieren. 


Netz- 


zugangs- Header: Nı I Hea N e zugangs- 
schicht i 1 schicht 


94 95 


a 3 


Da * 
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b Nennen Sie verschiedene Funktionen, die der Gerätetreiber für 
i ein WLAN-Modul, 
ii eine kabelgebundene Netzanbindung (LAN) 
dem Betriebssystem bereitstellen muss, und erläutern Sie, in welchen Punkten sich die bei- 
den Funktionsauflistungen aufgrund von physikalischen Eigenheiten der verwendeten 
Übertragungstechnologien unterscheiden müssen. 


Routing im Internet 

Das Internet stein Zusammenschluss vieler lokaler Rechnernetze, die über Router miteinander 

verbunden sind. Die Aufgabe eines Routers besteht dabei allein darin, eingehende Datenpa- 

kete in das richtige Teilnetz weiterzuleiten. 

a Ein neues Protokoll der Anwendungsschicht wird standardisiert. Erläutern Sie, inwiefern 
die Konfiguration der Router im Internet daraufhin angepasst werden muss, um auch die 
Daten dieses neuen Protokolls korrekt weiterleiten zu können. 

b Erklären Sie, weshalb die folgenden Aussagen so nicht korrekt sind, und verbessern Sie sie: 
i Um erfolgreich arbeiten zu können, muss ein Router lediglich ein geeignetes Protokoll 

der Internetschicht verstehen, da Routing bzw. Wegewahl Aufgabe der Internetschicht ist. 
ii Damit alle Geräte im Internet erfolgreich miteinander kommunizieren können, müssen 
sie auf der Netzzugangs- und Internetschicht alle die gleichen Protokolle unterstützen. 


Wireshark: Analyse des Protokollstapels 

Bei der Kommunikationsanalyse mit dem Programm Wireshark kann der in einzelnen Daten- 

paketen enthaltene „Protokollstapel” im unteren Teil des Hauptfensters aufgeschlüsselt und 

analysiert werden. Die Auflistung der Protokolle beginnt dabei jedoch mit der untersten 

Schicht, sodass etwaige Protokolle der Anwendungsschicht als letztes aufgeführt werden. Die 

Einträge in dieser Protokollliste können zudem „aufgeklappt“ werden, um Details zu den über- 

tragenen Protokollinformationen zu erhalten. 

a Öffnen Sie die Datei wireshark_smarthome. Ermitteln Sie, welche Transportschichtproto- 
kolle für welche Art von Datenübertragung zum Einsatz kommen, und beurteilen Sie je- 
weils die Sinnhaftigkeit der Protokollauswahl. 

b Versuchen Sie eigenständig anhand der vorliegenden Kommunikationsmitschnitte her- 
auszufinden, auf welche Weise bei TCP der korrekte Empfang aller versendeten Segmente 
sichergestellt wird. Überprüfen Sie Ihre Vermutung anschließend anhand der Protokoll- 
definition (RFC 793, Abschnitt 3.3). 

< Öffnen Sie die Datei wireshark_pptp und analysieren Sie den mitgeschnittenen Datenaus- 
tausch mit besonderem Augenmerk auf die verwendeten Kommunikationsprotokolle. 
Nennen Sie mögliche Anwendungsfälle für diese besondere Art der Protokollschichtung. 


Die oberen Schichten des ISO/OSI-Modells 

Das ISO/OSI-Modell sieht im Gegensatz zum TCP/IP-Modell sieben statt nur vier Schichten vor. 

Ein Teil der Aufgaben der Anwendungsschicht wird dabei auf zwei zusätzliche unter der An- 

wendungsschicht eingefügte Schichten verteilt (Darstellungs- und Kommunikationssteue- 

rungsschicht). Außerdem werden die Aufgaben der Netzzugangsschicht auf zwei Schichten 

(Bitübertragungs- und Sicherungsschicht) aufgeteilt. 

a Recherchieren Sie die Aufgaben, die den Schichten im ISO/OSI-Modell zugeordnet wer- 
den, und erläutern Sie insbesondere die Aufgaben der zusätzlichen Schichten mit eige- 
nen Worten. 

b Beim TCP/IP-Modell werden die Aufgaben der Darstellungs- und Kommunikationssteue- 
rungsschicht als Teil der Anwendungsschicht aufgefasst. Diskutieren Sie am Beispiel der 
Anwendungen „Webbrowser“ und „E-Mail-Client‘, inwieweit diese Zusammenfassung ge- 
rechtfertigt erscheint. 


3.2 Aufgaben sinnvoll verteilen: Das Schichtenmodell 


6 Vorteile des Schichtenmodells im Alltag 


Der Internetanschluss bei Ihren Großeltern soll von DSL über die Telefonleitung zu einem 
echten Glasfaseranschluss bis ins Haus umgestellt werden. Daraufhin werden Sie von Ihren 
Großeltern gefragt: „Brauchen wir deswegen jetzt einen komplett neuen Tablet-Computer?“. 
Erklären Sie Ihren Großeltern nachvollziehbar, weshalb dies nicht der Fall ist. 


Vertrauliche Kommunikation im Internet schützen 

Um vertrauliche Daten vor fremden Zugriffen während der Übertragung im Internet zu schüt- 

zen, können diese verschlüsselt werden. 

a Eine neue Software soll maximale Sicherheit bieten, indem sie sich in die Kommunikation 
des Rechners, auf dem sie läuft, einklinkt und sämtliche IP-Pakete vor der Übertragung 
komplett verschlüsselt. Erklären Sie, weshalb dies so nicht funktionieren kann. 

b Ein Ansatz, der das Problem aus Teilaufgabe a) umgeht, besteht darin, die komplett ver- 
schlüsselten IP-Pakete in einem weiteren IP-Paket zu „verpacken“ und dieses an einen spe- 
ziellen Rechner im Zielnetz zu senden, der das ursprüngliche IP-Paket „auspackt‘, ent- 
schlüsselt und anschließend unverschlüsselt im lokalen Netz überträgt. Stellen Sie dieses 
Vorgehen grafisch dar. Orientieren Sie sich dabei an der Darstellung zum Schichtenmodell 
auf S. 94. 


Online-Shop (aus Abitur 2017) 

Ein Online-Shop für Bücher nutzt zur Auslieferung der bestellten Ware an seine Kunden den 

Paketdienst: Der Kunde bestellt ein Buch, der Online-Shop verpackt das Buch in ein Paket 

zulässiger Größe und übergibt es einem Mitarbeiter des Paketdienstes, der es in das nächst- 

gelegene Verteilerzentrum bringt. Dort werden ankommende Pakete entsprechend ihrer Ziel- 

bestimmung sortiert und schließlich an das dem Zielort nächstgelegene Verteilerzentrum 

transportiert. Von dort wird das Paket durch einen weiteren Mitarbeiter des Paketdienstes in 

der betreffenden Paketstation deponiert, von der es der Kunde abholen kann. 

a Stellen Sie das gegebene Szenario in einem Schichtenmodell mit wenigstens drei Schich- 
ten dar. Machen Sie für jede Schicht deutlich, welche Aufgabe sie hat. 

b Beschreiben Sie einen Vorteil der Aufteilung eines Vorgangs in Schichten. 
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> URL: 


Uniform Resource 
Locator 


Für häufig ver- 
wendete Dienste 
sind verbindliche 
Ports festgelegt. 
Dafür ist der 
Bereich von 0 bis 
1023 reserviert. 
Beispiele sind Port 
80 für HTTP, 443 
für HTTPS, 110 für 


POP3. 


>?lP: 
Internet Protocol 


>2.2 
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3.3 Den Weg finden: Adressierung 


a Finden und notieren Sie Ihre IP-Adresse. Öffnen Sie dazu entweder die Eigenschaften 
Ihrer Verbindung (Windows) bzw. die Systemeinstellungen zu Netzwerken (Mac) oder 
öffnen Sie die Eingabeaufforderung (Windows) bzw. ein Terminal (Mac, Linux) und ge- 
ben Sie den Befehl ipconfig (Windows) bzw. ifconfig (Mac, Linux) ein. 

Hinweis: Falls Sie mehrere Adressen finden, notieren Sie die IPv4-Adresse. 

b Finden Sie mit einer Webseite („Wie ist meine IP“) heraus, welche IP-Adresse von Ihnen 
nach außen sichtbar ist. 

c Vergleichen Sie zu zweit gegenseitig die Resultate von a) und b). 

Mit dem Befehl tracert URL (Windows) bzw. traceroute URL (Mac, Linux) kann man sich den 

Weg anzeigen lassen, welches ein Datenpaket zu einem bestimmten Webserver zurücklegt. 

d Lassen Sie sich die Wege zu zwei verschiedenen Webservern (z. B. einer Suchmaschine, 
Homepage der Schule, ...) anzeigen. 

e Vergleichen Sie die beiden Wege hinsichtlich der einzelnen Stationen. 

f Finden Sie einen Online-Dienst, mit dem eine whois-Abfrage für eine IP-Adresse durch- 
geführt werden kann. Geben Sie die IP-Adressen der einzelnen Stationen ein und voll- 
ziehen Sie so den Weg nach. 


Adressierung auf der Anwendungsschicht 
Wie beim Versenden eines Briefes muss man auch beim Datenaustausch in Rechnernetzen die 
Adresse des Kommunikationspartners kennen. Da die Kommunikation in Schichten verläuft, 
werden unterschiedliche Adressen für die unterschiedlichen Schichten verwendet. Der Anwen- 
der gibt auf der Anwendungsschicht beispielsweise im Browser eine >URL (z.B. informatikschul- 
buch.de) ein, um eine Webseite aufzurufen. 


Adressierung auf der Transportschicht 

Auf der Transportschicht besteht eine Ende-zu-Ende-Verbindung zwischen den Kommunikati- 
onspartnern. Zwei so verbundene Geräte können parallel mehrere Kommunikationsstränge er- 
öffnen. Zur Unterscheidung dieser werden sogenannte Ports herangezogen. Ein Port ist eine 
Nummer von 0 bis 65535 (2'°-1). Beim Download einer Datei von einem Server kann dieser bei- 
spielsweise die einzelnen Segmente einer Datei an einen Port adressieren. Wird gleichzeitig ein 
weiterer Download gestartet, so kann ein anderer Port verwendet werden. Ports werden aber 
auch dazu verwendet, um bestimmte Dienste und damit verbundene Protokolle zu identifizieren. 
Ein E-Mail-Server wartet beispielsweise auf Port 25 auf eingehende SMTP-Verbindungen. 


Adressierung auf der Internet- und Netzzugangsschicht 

Damit das Zustellen von Datenpaketen über mehrere Netze hinweg und das dafür benötigte 
Routing auf der Internetschicht möglich ist, werden Rechner hier mit sogenannten >IP-Adressen 
identifiziert. IP-Adressen kommen in den Versionen IPv4 und IPv6 zum Einsatz. In lokalen Netzen 
werden bisher IPv4 Adressen häufiger genutzt. Diese sind 32 Bit lang und werden zur besseren 
Lesbarkeit in vier Dezimalblöcken geschrieben (z. B. 192.168.1.2). Der sogenannte Netzanteil 
einer IP-Adresse gibt an, in welchem Netz sich ein Gerät befindet. Große Firmen oder Einrichtun- 
gen haben eigene Netze und einen eigens definierten IP-Adressen-Bereich. Das Bundesministe- 
rium des Inneren hat beispielsweise IP-Adressen von 153.93.0.0 bis 153.93.255.255. Ein Gerät 
mit einer IP-Adresse, die mit 153.93 beginnt, befindet sich im Behördennetz. Der sogenannte 
Hostanteil der Adresse ist im LAN einmalig für ein Gerät vergeben. Anhand einer IP-Adresse kann 
schnell herausgefunden werden, in welchem Land und in welchem Netz sich ein Gerät befindet. 


Auf der Netzzugangsschicht werden Geräte mithilfe der >MAC-Adresse identifiziert. Sie ist 48 MAC: 


3.3 Den Weg finden: Adressierung a 


Bit lang und wird üblicherweise hexadezimal geschrieben (z.B. 12:34:DE:AD:BE:EF).Im Gegensatz Media-Access-Control 


zur IP-Adresse kann aus der MAC-Adresse nicht abgelesen werden, in welchem Land oder Netz 
sich ein Gerät befindet. 


Routing 

Router können ein oder mehrere Rechnernetze miteinander verbinden. Anhand einer sogenann- 
ten Routing-Tabelle trifft der Router Entscheidungen darüber, auf welchem Weg er ein Datenpa- 
ket weiterleitet. Der hierarchische Aufbau der IP-Adressen trägt dazu bei, dass nicht für jede 
Adresse ein Eintrag angelegt werden muss, sondern nur für ganze Bereiche. Zudem kann die 
Tabelle eine Metrik, d. h. eine Angabe über die Länge des Wegs bis zum Ziel, enthalten. 


nächste versendete 
Routeradresse | Routeradresse 


Ziel- 
Adressbereich 


Routing-Tabelle für 
Router 1 (s. unten). 


10.43.3.* | 10.43.3.1 10.43.3.1 'o 
Für alle Daten- 153.93,* | 12.15.3.1 12.15.3.2 E 
ENDE 192.168.0% | 12.153.1 | 12.15.3.2 2 
Hk anger .168.0. 15.3. 15.3. 
ordnet werden _ __- | 0.0.0.0 | 12.15.3.1 | 12.15.3.2 E 
können, 


* steht für beliebige Zahlen. 


Beispielkommunikation in einem LAN - Zuordnung von IP-Adressen zu MAC-Adressen 
Gerät 1 möchte mit Gerät 2 kommunizieren und kennt zwar dessen IP-Adresse (10.43.3.8), nicht 
jedoch dessen MAC-Adresse. Um die MAC-Adresse eines Kommunikationspartners zu ermitteln, 
wird das Address Resolution Protocol (ARP) verwendet. Gerät 1 schickt hierzu über den Switch 
an alle Teilnehmer des Netzes die Frage, wie die MAC- 

Adresse von 10.43.3.8 lautet. Der Switch leitet die Frage MAC-Adresse 

an alle Teilnehmer im Netz weiter. Gerät 2 sendet seine 10.43.3.8 AF:C7:32:40:DD:30 
MAC-Adresse als Antwort über den Switch zurück zu 10.43 3.1 B4:00:79:26:A2:34 


Gerät 1. Dieses kann nun mit Gerät 2 kommunizieren. 048320 ARSOARECERAA | 
Die Zuordnung der IP-Adressen zu den MAC-Adressen _ nn 


kann in sogenannten ARP-Tabellen der Geräte gespei- Beispiel für eine ARP-Tabelle 
chert werden. 


Gerät 3 Gerät 4 


Router MN Router 2 
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Beispielkommunikation über Netzwerkgrenzen hinaus 


MAC-Adr. MAC-Adr. 
Gerät4 Router2 


MAC-Adr. MAC-Adr. MAC-Adr. MAC-Adr. 
Router 1 Gerät 1 Router2 Router 1 


& Router 1 & Router 2 Gerät 4 [__] 


Gerät 1 möchte mit Gerät 4kommunizieren und kennt dessen IP-Adresse sowie den Port, welcher 
für die Kommunikation verwendet wird. Auf der Transport- und Internetschicht werden daher 
der Zielport und die IP-Adresse von Gerät 4 angegeben. Da Gerät 1 am Netzanteil der IP-Adresse 
erkennt, dass Gerät 2 nicht im gleichen Netz ist, wird auf der Netzzugangsschicht an Router 1 
adressiert und (über den Switch) dorthin gesendet. Router 1 erkennt anhand seiner Routing- 
tabelle (s. vorherige Seite), dass er die Nachricht an Router 2 weiterleiten muss. Er ersetzt daher 
auf der Netzzugangsschicht die Empfängeradresse durch die von Router 2 und gibt seine eigene 
MAC-Adresse als Absenderadresse an. Router 2 erkennt durch seine Routingtabelle, dass die 
Zieladresse im eigenen Netz ist, und adressiert auf Netzzugangsschicht an Gerät 4. Als Absender- 
MAC-Adresse gibt er seine eigene Adresse an. So gelangt das Paket (über den Switch) zu Gerät 4. 
Dieses erhält ein Datenpaket, das auf der Vermittlungsschicht die IP-Adresse von Gerät 1 als 
Absender enthält, auf Netzzugangsschicht die MAC-Adresse von Router 2. Dadurch kann eine 
Antwort auf die Nachricht wieder zurückgeschickt werden. 


Namen statt IP-Adressen 

IP-Adressen sind lange Zahlen und für Menschen daher schwer zu merken. Deshalb kann man 
jedem Gerät einen Namen geben. Über eine Art Telefonbuch kann dann zu jedem Namen die 
IP-Adresse herausgefunden werden. Zur schnelleren Suche sind diese Namen hierarchisch in 
so genannten Domains strukturiert (z. B. schule.infohausen.de). Der Anwender kann im Browser 
den vollständigen Rechnernamen eingeben. Das Domain Name System (DNS) ermittelt dann 
zu diesem Namen die IP-Adressen. 


Für die Kommunikation im Internet müssen die beteiligten Geräte mit Adressen identifiziert 
werden. In den verschiedenen Schichten des 
TCP/IP-Modells werden verschiedene Adressen 
verwendet. Auf der Transportschicht verwenden anspo ich 
Server Ports, um bestimmte Dienste anzubieten. | Internetschicht | —»> IP-Adresse 
Ports werden zudem verwendet, um mehrere => MAC-Adresse 
Kommunikationsstränge zwischen gleichen 
Partnern auseinanderzuhalten. IP-Adressen sind 
auf der Internetschicht zu finden. Zusammen mit Routing-Tabellen verwenden Router die 
IP-Adressen, um für Datenpakete einen Weg über verschiedene Netze hinweg zu finden. Auf 
der Netzzugangsschicht wird ein Gerät über die MAC-Adresse identifiziert. 

Das Domain Name System (DNS) ordnet Domains IP-Adressen zu und ermöglicht so auf der 
Anwendungsschicht die Verwendung von Namen anstatt IP-Adressen. 


Aufgaben 


1 Datenpakete 

Die Abbildung zeigt stark vereinfacht einen Ausschnitt aus der Kommunikation zwischen zwei 

Geräten. 

a Geben Sie an, welcher Teil der Internet- und welcher Teil der Netzzugangsschicht zuge- 
ordnet werden kann. Begründen Sie Ihre Meinung. 

b Geben Sie die IP-Adressen und die MAC-Adressen von Gerät 1 und Gerät 2 an. 

c Erklären Sie sich gegenseitig den Austausch von Daten über zwei Netze hinweg an die- 
sem Beispiel. Gehen Sie bei Ihrer Erklärung insbesondere auf die farbig hinterlegten Teile 
ein. Verwenden Sie folgende Begriffe: IP-Adresse, MAC-Adresse, Routing. 


10.43.3.3 192.168.0.3 
(Empfänger) | (Absender) 
L >) 
4 12:34:DE:AD:BE:EF | 00:80:41:AE:FD:7E 
Gerät 1 (Empfänger) (Absender) Router 1 


[ ] 192.168.0.1 =— 10.15.3.1 
10.43.3.3 192.168.0.3 
‚emp (Absender) 


192.168.0.1 nr | |... 10.15.3.2 ee" 
10.43.3.3 192.168.0.3 
„(Eopanse) (Absender) 


10.15.3.2 a 


2 Wo wohnst du, wie heißt du? - Adressen im Vergleich 
Zur Veranschaulichung von Adressen in Netzen werden oft Postadressen herangezogen. Eine 
IP-Adresse in einem Netz wird dabei z. B. mit einer Adresse bestehend aus Land, Postleitzahl, 
Straße mit Hausnummer und Namen verglichen. 
a Beurteilen Sie, welche Aspekte dieses Vergleichs 


stimmig, welche unpassend sind, und diskutie- Lieber Tim, 
ren Sie Ihre Ergebnisse in der Gruppe. das Wetter ist schön, ei 
N . die Sonne scheint. im Buktu 
b Eine andere Analogie betrachtet den Namen als ee Netzwerkstraße 11 
MAC-Adresse und den Rest der Postadresse als ich bin glücklich! 76543 Sommerloch 
IP-Adresse. Zeigen Sie Stärken und Schwächen DeineiEya Germany 


dieses Vergleichs auf. 

c Eine Postkarte wird aus dem Ausland nach 
Deutschland versendet. Geben Sie an, welcher Teil der Adresse für die folgenden Statio- 
nen von Bedeutung sind: Verteilungszentrum im Ausland, zentrales Verteilungszentrum 
in Deutschland, Postamt vor Ort. 

d Erläutern Sie eine Analogie zwischen den in c) genannten Stationen und den Begriffen 
Absender, Router, Empfänger. 

e Ports werden oft mit Abteilungsnamen in einer Firma verglichen. Erklären Sie diese 
Analogie. 


3.3 Den Weg finden: Adressierung a 


ao 


ABAD 
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@ &R 3 Mangelware IP-Adressen 


& 


[6 


a Eine IPv4-Adresse besteht aus 32 Bit. Berechnen Sie, wie viele verschiedene IPv4-Adressen 
es geben kann. 

b Recherchieren Sie die Anzahl der internetfähigen Geräte und vergleichen Sie sie mit dem 
Ergebnis aus a). 

c Eine IPv6-Adresse besteht aus 128 Bit. Berechnen Sie, wie viele verschiedene Adressen es 
hier geben kann. 

d Berechnen Sie, wie viel IPv6-Adressen man für einen Quadratmillimeter der Erdoberfläche 
zur Verfügung stellen könnte, wenn man die Adressen gleichmäßig verteilen würde. Ge- 
hen Sie von einer Oberfläche von 510 Millionen Quadratkilometern aus. 

e Für Schnelle: Recherchieren Sie die übliche Darstellung einer IPv6-Adresse und verglei- 
chen Sie diese mit dem Aufbau einer IPv4-Adresse. 


Wireshark: MAC-Adressen im lokalen Netz aufspüren 

a Finden Sie Ihre eigene IP-Adresse im lokalen Netz heraus (siehe Einstiegsaufgabe). Teilen 
Sie die Adresse Ihrer Nachbarin bzw. Ihrem Nachbarn mit. 

b Öffnen Sie Wireshark und starten Sie die Aufzeichnung. Öffnen Sie die Eingabeaufforde- 
rung (Windows) bzw. ein Terminal (Mac, Linux) und pingen Sie Ihren Nachbarn oder Ihre 
Nachbarin mit dem Befehl ping IP-Adresse an. 

Stoppen Sie die Aufzeichnungen und setzen Sie den Filter auf ARP (Address Resolution 
Protocol). 

c Identifizieren Sie die Anfrage Ihres Computers, in welcher er nach der MAC-Adresse zur 
angefragten IP-Adresse fragt. Geben Sie an, welche MAC-Adresse hier als Empfänger an- 
gegeben ist. 

d Identifizieren Sie die Antwort auf diese Anfrage und geben Sie die MAC-Adresse Ihres 
Nachbarn bzw. Ihrer Nachbarin an. Überprüfen Sie sich gegenseitig, indem Sie Ihre eigene 
MAC-Adresse herausfinden (z.B. über die Eigenschaften der Verbindung (Windows) bzw. 
über die Systemeinstellungen Netzwerk (Mac) oder mit einem passenden Befehl auf der 
Eingabeaufforderung/ dem Terminal). 

e Ihr Computer hat eine ARP-Tabelle, in welcher zu allen bekannten MAC-Adressen die pas- 
senden IP-Adressen gespeichert sind. Lassen Sie sich diese Tabelle mit dem Befehl arp -a 
anzeigen und überprüfen Sie, ob der Eintrag passend zu Aufgabe d) vorhanden ist. 

f Für Schnelle: Bei Verwendung von IPv6-Adressen kommt das Address Resolution Protocol 
nicht mehr zum Einsatz. Recherchieren Sie den Namen und die Funktionsweise des pas- 
senden Protokolls, welches hier stattdessen angewendet wird. 


Wireshark: Adressen im Protokollstapel 

a Finden Sie Ihre eigene IP-Adresse im lokalen Netz heraus (s. Einstiegsaufgabe). 

b Öffnen Sie Wireshark und starten Sie die Aufzeichnung. Öffnen Sie einen Browser und 

rufen Sie eine HTTPS-Webseite auf (z.B. informatikschulbuch.de). Stoppen Sie nach dem 

Laden der Seite die Aufzeichnung in Wireshark. 

Geben Sie in Wireshark als Filter „dns“ ein. Nennen Sie die Bedeutung dieser Abkürzung. 
d Finden Sie ein Datenpaket, welches Ihre IP-Adresse als Absender hat, und eines, welches 
die Antwort auf diese Anfrage ist. Geben Sie anhand dieser Antwort die IP-Adresse an, 

welche zur im Browser aufgerufenen Domain gehört. 

e Finden Sie im Protokollstapel auf Ebene der Transportschicht die in d) verwendeten Ports. 
Recherchieren Sie den Standardport für DNS und vergleichen Sie. 

f Entfernen Sie den eingestellten Filter und filtern Sie stattdessen nach Datenpaketen mit 
der Ziel-IP-Adresse der aufgerufenen Webseite (ip.dst == [IP-Adresse]). Überlegen Sie sich 
zunächst, welche verwendeten Ports, Empfänger-IP-Adressen und MAC-Adressen Sie in 
diesem Kommunikationsausschnitt kennen könnten. Überprüfen Sie Ihre Vermutung an- 


n 


3.3 Den Weg finden: Adressierung 


schließend, indem Sie den Protokollstapel von einzelnen Datenpaketen durchgehen. Ge- 
ben Sie dabei auch die MAC-Adresse des Webservers an, der die aufgerufene Webseite zur 
Verfügung stellt. 


6 Rechnernetze simulieren - Teil 2 


a Verwenden Sie eine Simulationssoftware wie z.B. die Lernanwendung Filius, um das ab- 
gebildete Rechnernetz aufzubauen. 


Gerät 1 


10.10.10.2 10.10.10.1 


wer 
Ber 
Gerät 2 _] 5.5.5.1 


10.10.10.3 


[ ] Gerät 3 
rl 2 5552 


b Installieren Sie auf Gerät 1 die Befehlszeile. Lassen Sie sich die ARP-Tabelle vor und nach 
dem Anpingen von Gerät 2 anzeigen. Versuchen Sie Gerät 3 anzupingen. 

c Damit eine Kommunikation zwischen den Teilnetzen möglich ist, muss an den Geräten 
der richtige >Gateway eingestellt werden. Setzen Sie den Gateway für alle Geräte pas- 
send und testen Sie mittels ping die Erreichbarkeit der Geräte. 

d Installieren Sie auf Gerät 1 eine Firewall sowie einen Echo-Server und auf Gerät 3 einen 
einfachen Client. Versuchen Sie eine Verbindung zum Echo-Server aufzubauen. Erklären 
Sie anhand der Log-Files der Firewall, warum kein Verbindungsaufbau möglich ist. 

e Fügen Sie auf der Firewall eine neue Regel mit dem passenden Port ein. Testen Sie. 

f Versuchen Sie weitere Komponenten (z. B. DNS-Server, Webserver und Webbrowser) auf 
den Geräten zu installieren und zu verwenden. Erweitern Sie das Netz. 


Netzwerkadressübersetzung (>NAT) 

In kleinen Netzen werden häufig private IP-Adressen verwendet. Diese sind nicht im öffentli- 

chen Teil des Internets vergeben. In Heimnetzen werden beispielsweise sehr häufig Adressen 

ab 192.168.0.0 verwendet. 

a Beim Versenden von Daten von einer privaten Adresse zu einer öffentlichen Adresse tritt 
zunächst kein Problem auf. Auf der Transportebene ist die private IP-Adresse als Absender 
angegeben. Erklären Sie, welches Problem entsteht, wenn eine Antwort auf die Anfrage 
gesendet werden soll. 

b Moderne Router können Source-NAT einsetzen: Sie ersetzen die IP-Adresse des privaten 
Absenders durch ihre eigene öffentliche. Zusätzlich ersetzen Sie auch den ursprünglich 
verwendeten Port. In einer Tabelle des Routers wird die Zuordnung von privater IP zu öf- 
fentlicher IP sowie der verwendeten Ports gespeichert. Geben Sie an, wie sich die Daten- 
pakete aus dem Beispiel im Lehrtext bei der Kommunikation über Netzwerkgrenzen hin- 
weg ändern. 

c Erklären Sie, warum durch NAT IP-Adressen „gespart“ werden können. 

d Für Schnelle: Recherchieren Sie den Unterschied zwischen Source-NAT und Destination- 
NAT und stellen Sie diesen der Klasse vor. 


DO 
[©) 
AR 


R 


> engl. gateway (Zu- 
gangsweg, Torweg): 
Router in einem lo- 
kalen Netz, über wel- 
chen das Netz an an- 
dere Netze oder das 
Internet angebun- 
den ist 


DRK 


> NAT: 


Network Address 
Translation 
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HTML ist eine Auf- 
zeichnungssprache 
zur Gestaltung von 
Webseiten (s. L3). 
Daneben können 


auch andere Nutzer- 
daten (z.B. Binär- 
daten von Bildern) 
übertragen werden. 
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3.4 Webseiten aus dem Internet abrufen: HTTP 


Viele moderne Webbrowser enthalten sogenannte Entwicklerwerkzeuge, mittels derer das 

Abrufen und der Aufbau von Webseiten im Detail analysiert werden kann. 

a Führen Sie eine Analyse der Netzkommunikation zwischen Client (Browser) und Web- 
server beim Laden der Seite informatikschulbuch.de durch. Verwenden Sie dafür die 
vom Browser in den Entwicklerwerkzeugen bereitgestellte Netzwerkanalysefunktion. 
Anleitungen zur Bedienung dieser Funktion stehen als Download zur Verfügung. 

b Untersuchen Sie das Ergebnis der Netzwerkanalyse von a): Beschreiben Sie, welche Da- 
teien beim Abrufen der Webseite übertragen wurden, und äußern Sie eine Vermutung, 
welchem Zweck diese vermutlich dienen. 

c Durch Anklicken der übertragenen Dateien in der Ausgabe der Netzwerkanalyse erhal- 
ten Sie weitere Details zur Übertragung. Ermitteln Sie auf diesem Weg folgende Infor- 
mationen. 

« Wie meldet der Server dem Client, dass er die angefragte Datei liefern kann? 
+ Wie erkennt der Client, in welchem Format die gelieferte Datei codiert ist? 


Ein Anwendungsprotokoll genau betrachtet: Ablauf einer HTTP-Anfrage 

Unter all den Anwendungsprotokollen, welche im Internet verwendet werden, spielt das zum 
Abrufen von Webseiten verwendete Hypertext Transfer Protocol (HTTP) eine besonders zentrale 
Rolle. Der Nachrichtenaustausch zum Abruf einer Seite von einem Server folgt dabei einem recht 
einfachen Schema. 

Eine einfache Anfrage des Clients hat z. B. folgenden Aufbau: 


Webbrowser 
(Client) Webserver 


: GET-Request 
GET-Request relativer Pfad zur Protokoll- 


# angefragten Datei versiön 


GET /index.php HTTP/2 
Host: informatikschulbuch.de 


[..hier ggf. noch weitere ee 


Eine komplett leere Zeile markiert Der Parameter „Host“ gibt die 
das Ende der Anfrage. Adresse der Stammwebseite an. 


Serverantwort 


Die Antwort des Servers besteht aus einem sogenannten Header, gefolgt von den angefragten 
Nutzdaten. Im Header kann der Server dem Client dabei verschiedene Zusatzinformationen mit- 
teilen, beispielsweise ob die Anfrage erfolgreich war, oder auch, in welchem Format die Nutzda- 
ten codiert sind. 

Statuscode des Servers 
(hier: erfolgreiche Anfrage) 


HTTP/2 200 OK 
server: Apache/2.4.48 (Unix) 
content-type: text/html; charset=UTF-8 


Header 


[..hier ggf. noch weitere Parameter..] 


Eine komplett leere Zeile trennt 


<!DOCTYPE html> 
Header und Nutzdaten. 


Nutzdaten ! 
| 
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Verschlüsselter Datenaustausch mit HTTPS 

Um die Vertraulichkeit der Kommunikation zu gewährleisten, erfolgt der Datenaustausch beim 
Protokoll HTTPS in verschlüsselter Form. Der eigentliche Nachrichtenaustausch zwischen Client 
und Server findet innerhalb dieses gesicherten Kanals auf die gleiche Weise statt wie bei HTTP. 


GET _—— ...Jsahfueoicldmieovewvpcxe... _— GET 
HTTP/2 200 OK... + — n ...gpewewiucamzcxpcnruicn... In «——— HTTP/2 200 OK... 
Cookies identifizieren Clients 
Einzelne HTTP(S)-Anfragen sind voneinander unabhängige Vorgänge. Meldet sich ein Nutzer 
oder eine Nutzerin bei einem Onlineportal an und klickt anschließend auf einen Link, um bei- 
spielsweise das eigene Profil anzusehen, so kann der Webserver nicht ohne weiteres feststellen, 
ob die zwei Anfragen vom gleichen, bereits angemeldeten Client stammen. Es könnte sich auch 
um eine Anfrage eines böswilligen Angreifers handeln, der es auf das Ausspähen nicht für ihn 
bestimmter Daten abgesehen hat. 
Damit Zugangsdaten oder Einstellungen nicht bei jeder Anfrage neu eingegeben werden müs- 
sen, können sogenannte Cookies eingesetzt werden. Ein Cookie ist eine kleine Textdatei, die vom 
Server generiert, an den Client übermittelt und dort gespeichert wird. Beispäteren Anfragen wird 
der Client dann aufgefordert, den Inhalt dieser Textdatei als Teil der Anfrage mit zu senden. So 
ist beweisbar, dass es sich immer noch um den gleichen Client handelt. 
In der Praxis wird dieses Verfahren jedoch häufig auch von Werbeanbietern eingesetzt, um die 
Aktivitäten von Nutzern im Internet verfolgen zu können (sog. >Tracking-Cookies). Da große 
Werbeanbieter in der Regel auf vielen verschiedenen Webseiten mit ihrer Werbung präsent sind, 
können sie mittels geeigneter Cookies das Surfverhalten einzelner Nutzer auch über die Grenzen 
einzelner Webseiten hinaus detailliert nachvollziehen. 


Webbrowser 


(Client) Webserver Cookie erzeugen 


und an Client 
Zugangsdaten senden... senden 


L & 
R- 1101 
„_H7P2200 0K... om.) | 
& D 
110 18 Server kann An- 
GET profil.html... Be fragen anhand 


des Cookies zu- 
ordnen 


Cookie wird lokal gespeichert 
und bei nachfolgenden 
Anfragen zurück an den 
Server gesendet 


HTTP2 200 OK... 


Zum Abrufen von Webseiten im Internet wird in der Regel das Hypertext Transfer Protocol 
(HTTP) eingesetzt. Heutzutage wird die Kommunikation dabei zusätzlich verschlüsselt 
(HTTPS). Wie auch bei anderen Protokollen, muss bei der Übertragung zwischen dem 
Header, welcher protokollspezifische Steuerinformationen enthält, und den eigentlichen 
Nutzdaten unterschieden werden. Eine Identifikation von Nutzern über einzelne Anfragen 
hinweg wird durch die Verwendung von Cookies möglich. 


> Engl. to track: 
nachverfolgen 
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BABRA 


Die Steuerzei- 
chen \r und \n 
sind von alten 
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für Rücklauf des 
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für neue Zeile. 
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Aufgaben 


1 Implementierung eines HTTP(S)-Clients 

In dieser Aufgabe soll ein einfacher HTTP(S)-Client implementiert werden, welcher den zuvor 
beschriebenen einfachen Abruf einer Datei beherrscht. Aufgrund der Protokollstapelung im 
Schichtenmodell (siehe S.93) kann für die Verwaltung der Ende-zu-Ende Kommunikationsver- 
bindung auf eine bereits vorhandene TCP/IP-Implementierung zurückgegriffen werden. In der 
bereitgestellten Projektvorlage ist bereits folgende Grundstruktur angelegt: 

Mittels der Methode nameAufloesen kann die zu einem Domainnamen gehörige IP-Adresse 
ermitteltwerden. Über die Klassen TRANSPORTSCHICHT_TCP bzw. TRANSPORTSCHICHT_TCP_ 
TLS kann eine TCP-Verbindung aufgebaut werden. Bei TRANSPORTSCHICHT_TCP werden die 
Nutzdaten im Klartext übertragen; bei TRANSPORTSCHICHT_TCP_TLS erfolgt die Kommuni- 


kation TLS-verschlüsselt. 
DNS_RESOLVER 
EEE 
nameAufloesen(name) 


<<Interface>> 
TRANSPORTSCHICHT 


verbindungAufbauenf(ip, port) 
verbindungAbbauenf(ip, port) 
nachrichtSenden(msg) 


HTTP_CLIENT 
| 


httpRequestSenden(domain, path) 
httpsRequestSenden(domain, path) 


TRANSPORTSCHICHT_TCP 


TRANSPORTSCHICHT_TCP_TLS 


Ergänzen Sie jeweils den Rumpf der Methoden httpRequestSenden und httpsRequestSenden, 

sodass die Methodenaufrufe 

1) httpRequestSenden("test.informatikschulbuch.de', "/login.php") 

2) httpsRequestSenden("test.informatikschulbuch.de‘, "/login.php") 

eine Antwort des Servers mit einem Statuscode < 400 bewirken. Dafür sind folgende Einzel- 

schritte notwendig: 

a Zunächst muss mittels einer DNS-Abfrage die zu der als Parameter übergebenen Domain 
gehörige IP-Adresse ermittelt und in einer lokalen Variable zwischengespeichert werden. 
Erstellen Sie hierfür ein Objekt der Klasse DNS_RESOLVER und verwenden Sie die Metho- 
de namenAufloesen. 

b Anschließend muss ein Objekt der Klasse TRANSPORTSCHICHT_TCP bzw. TRANSPORT- 

SCHICHT_TCP_TLS erzeugt und die Verbindung zum Server aufgebaut werden. Für unver- 

schlüsselte und verschlüsselte HTTP-Verbindungen gibt es jeweils standardisierte Ports, 

welche sich durch eine kurze Internetrecherche schnell herausfinden lassen. 

Nachdem die Verbindung zum Server aufgebaut ist, kann direkt mit dem HTTP-Server kom- 

muniziert werden. Zum Abrufen einer Webseite muss nun ein GET-Request gesendet wer- 

den, um dem Server diesen Wunsch mitzuteilen. Dabei ist zu beachten, dass bei HTTP jede 

Zeile mit den unsichtbaren Steuerzeichen \r\n enden muss und am Ende des Requests eine 

komplett leere Zeile (erzeugt durch \r\n\r\n am Ende der letzten Textzeile) stehen muss. 

d Testen Sie die oben genannten Methodenaufrufe und prüfen Sie, ob der Server auf geeig- 

nete Weise (mit einem Statuscode < 400) antwortet. Der Abbau der Verbindung muss 

nicht explizit implementiert werden: Die Verbindung wird entweder durch den Server 
oder beim Beenden des Programms automatisch geschlossen. 

Analysieren und vergleichen Sie die Antwort des HTTP-Servers bei den Requests 1) und 2) 

(vgl. oben). Achten Sie dabei insbesondere auf die übermittelten Nutzdaten und den im 

Header übertragenen Statuscode. Die Bedeutung der Statuscodes kann via Internetre- 

cherche oder z.B. in RFC 2616 nachgeschlagen werden. 

Erläutern Sie einen möglichen Grund für die unterschiedlichen Antworten des Servers. 
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3.4 Webseiten aus dem Internet abrufen: HTTP a 


qg Die HTTP-Antwort zu Abfrage 2) enthält im Header unter anderem die folgende Zeile: 
Set-Cookie: PHPSESSID=XxxxXXXxXXXXXXXXXXXXXXXXXXXX/ 
Erklären Sie die Bedeutung dieser Zeile. 


Weitere HTTP-Headerparameter jum] 

Viele internationale Internetplattformen sind über eine .com-Adresse erreichbar. Deutsche 

Nutzerinnen und Nutzer bekommen beim Aufruf dieser Webseiten jedoch automatisch eine 

deutsche Version der Webseite angezeigt, während z. B. britische Nutzerinnen und Nutzer 

ebenso automatisch eine englischsprachige Version der Webseite angezeigt bekommen. 

a Rufen Sie eine solche Webseite im Webbrowser auf und analysieren sie mithilfe der 
Entwicklerwerkzeuge (vgl. Einstiegsaufgabe) die bei der Anfrage übertragenen HTTP- 
Headerparameter. Ermitteln Sie den für die automatische Sprachenwahl relevanten Hea- 
derparameter. 

b Verwenden Sie den HTTP-Client aus Aufgabe 1 und versuchen Sie, die Webseite aus a) 
nacheinander in verschiedenen Sprachen abzurufen. 

c Für Schnelle: Versuchen Sie dem Webserver durch eine geeignete Parameterwahl vorzu- 
spielen, dass es sich bei Ihrem Client um ein Mobilgerät handelt, und überprüfen Sie, in- 
wieweit dies Einfluss auf das ausgelieferte Webseitenformat hat. 


Webservices 

Neben dem Abrufen von Webseiten kann das HTTP(S)-Protokoll auch für den internen Daten- 

austausch zwischen Anwendungen verwendet werden. Ein Serverprogramm, das eine solche 

festgelegte Schnittstelle bereitstellt, wird Webservice genannt. Clientprogramme, wie z. B. 

eine Smartphone-App, können diese Schnittstelle nutzen, um im Hintergrund via HTTP(S) 

Daten abzurufen und zu manipulieren oder anderweitige Aktionen auf der Serverseite anzu- 

stoßen. Um diese Art des Datenaustausches vom klassischen,Websurfen” abzugrenzen, spricht 

man in diesem Kontext auch von sogenannter Maschine-zu-Maschine-Kommunikation. 

a Erläutern Sie Vor- und Nachteile, die sich bei der Maschine-zu-Maschine-Kommunikation 
aus der Verwendung des etablierten HTTP(S)-Protokolls anstelle eines eigens für diesen 
Zweck entwickelten Protokolls ergeben. 

b Neben dem zum Webseitenabruf benutzten GET-Befehl unterstützt das HTTP(S)-Protokoll 
noch eine Reihe weiterer Befehle. Formulieren Sie eine Hypothese, welche Datenmanipu- 
lationsoperationen jeweils durch die Befehle POST, PUT, PATCH und DELETE angestoßen 
werden, und überprüfen Sie Ihre Vermutung durch eine kurze Internetrecherche. 

c Webseiten werden in der Regel im HTML-Format codiert übertragen und anschließend in 
einem Browser angezeigt. Bei Webservices sollen die übertragenen Daten hingegen vom 
empfangenden Programm weiterverarbeitet werden. Hierfür kommen oft die Codie- 
rungsformate XML und JSON zum Einsatz. Beschreiben Sie nach einer kurzen Internet- 
recherche den Aufbau dieser Formate anhänd selbst gewählter Beispiele und diskutieren 
Sie Vor- und Nachteile der beiden Codierungsformen. 

d Beschreiben Sie eine mögliche Webservice-Schnittstelle für einen Essenslieferdienst. Mit- 
tels einer App, welche auf den Webservice zugreift, sollen Essensbestellungen aufgege- 
ben und storniert werden können. Weiterhin soll der aktuelle Status einer Bestellung je- 
derzeit abgefragt werden können. 

e Für Schnelle: Recherchieren Sie die Kernaussagen des REST-Paradigmas und erläutern 
Sie, weshalb dieses Programmierparadigma insbesondere bei der Umsetzung von Web- 
services von Bedeutung ist. 
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3.5 Dienste des Internets verwenden: Chancen und Risiken 


Ein Gedankenexperiment: Sie wollen Ihre Schulnoten auf unlautere Art und Weise durch die 
Ausnutzung von Sicherheitslücken „aufbessern“. An Ihrer Schule erfolgt die Notenverwal- 
tung durch ein Webportal, in welchem die Lehrkräfte Noten eintragen und auch ändern 
können. Der Zugang ist nur mit korrektem Benutzernamen und Passwort möglich. 

a Erläutern Sie, auf welchem Weg Sie sich als unbefugte Person Zugriff auf die Noten- 
verwaltung verschaffen könnten, und schildern Sie das dafür notwendige Vorgehen im 
Detail. 

b Alternativ wäre denkbar, dass die Noten sämtlicher Schülerinnen und Schüler auf Pa- 
pier in einem Aktenordner im Schulsekretariat verwaltet werden. Vergleichen Sie diese 
Vorgehensweise mit der zuvor beschriebenen Online-Notenverwaltung hinsichtlich 
Datensicherheit und Zugriffsschutz. 

c Für Schnelle: Recherchieren Sie, welche strafrechtlichen Konsequenzen ein unerlaubter 
Zugriff auf die Notenverwaltung sowie die Änderung von Noten haben könnte. 


Gemeinsam stark 

Rechnernetze sind in vielen Alltagssituationen mittlerweile unersetzlich geworden: Ein Geldau- 
tomat kann z. B. nur funktionieren, solange er eine Verbindung zum Rechenzentrum der Bank 
hat. Auch viele Apps auf Smartphones und Tablets (Messenger, Online-Kartendienste, soziale 
Netzwerke, usw.) können ohne Internetverbindung nicht sinnvoll genutzt werden. Zweifellos 
bietet die Vernetzung einzelner Rechner miteinander viele Vorteile, weshalb es heute kaum noch 
Firmen und Privathaushalte ohne Anschluss an das Internet gibt. 


Globale Ressourcen lokal verfügbar 

Eine wichtige Kategorie internetbasierter Dienste sind soge- 
nannte Cloud-Dienste. Dabei können Kunden Rechenleis- 
tung, Online-Dienste und Speicherkapazität in Rechenzen- 
trenaufderganzen Welt kurzfristig und nach Bedarfanmieten. 
Wo die Rechenzentren stehen, wer sie betreibt und wie diese 
aufgebaut sind, wird dabei aus technischer Sicht zunehmend 
unwichtig, was durch das Bild der diffusen „Wolke“ zum Ausdruck gebracht wird. Wegen der 
weltweiten Verfügbarkeit von Cloud-Diensten, die es auch ermöglicht von unterschiedlichen 
Standorten an gemeinsamen Dokumenten zu arbeiten, entschließen sich mehr und mehr Un- 
ternehmen dazu, ihre kompletten Datenverarbeitungsprozesse,in die Cloud“ auszulagern. Auch 
im privaten Bereich finden Cloudspeicherdienste und andere cloudbasierte Dienstleistungen 
zunehmend Verbreitung. 


Gefahren aus dem Internet 

Doch auch die Verbreitung von Schadsoftware und das unbefugte Ausspähen oder Manipulieren 
von Daten wird durch das Internet wesentlich leichter möglich. Eine erhebliche Rolle spielen 
dabei nicht geschlossene Sicherheitslücken in der verwendeten Software (weil entsprechende 
Sicherheitsupdates entweder nicht verfügbar sind oder aufgrund von Nachlässigkeit nicht ein- 
gespielt wurden). Ebenso kann die Spezifikation der verwendeten Kommunikationsprotokolle 
Schwachstellen enthalten, z.B.wenn das Protokoll dieVerwendung unsicherer Verschlüsselungs- 
verfahren vorsieht. 


3.5 Dienste des Internets verwenden: Chancen und Risiken 


Schutzmechanismen 

Um die Angriffsmöglichkeiten aus dem Internet zu reduzieren, kann eine sogenannte Firewall 
am Verbindungspunkt eines lokalen Netzes mit dem Internet oder auf individuellen Geräten 
verwendet werden. Dabei handelt es sich um spezielle Software, welche den Datenverkehr vom 
und ins Internet überwacht und nach zuvor festgelegten Regeln filtert. Auf diese Weise kann der 
Datenverkehr auf bestimmte Protokolle oder explizit festgelegte Adressen beschränkt werden. 
Bei einem Geldautomaten wäre z. B. denkbar, nur das zur Kommunikation mit der Bank verwen- 
dete Protokoll und nur die Geräte im Rechenzentrum der Bank als Zielrechner zu gestatten. 
Weitere Schutzmechanismen gegen Missbrauch sind Virenscanner, Verschlüsselungen sowie zur 
Wahrung der Privatsphäre Datensparsamkeit und entsprechende Datenschutz-Einstellungen bei 
Browsern und Apps. In Firmennetzen sind zudem oft sogenannte Intrusion Detection Systeme 
(IDS) installiert, welche den Datenverkehr im lokalen Netz analysieren und unbefugte Aktivitäten 
erkennen sollen. Häufig kommen dabei auch Kl-gestützte Verfahren zur Erkennung von Unregel- 
mäßigkeiten zum Einsatz. Regelmäßige Backups können zudem dabei helfen, einen größeren 
Datenverlust im Schadensfall zu vermeiden. 


Risikofaktor Mensch 

Neben rein technischen Sicherheitslücken wird oft auch die Schwachstelle Mensch ausgenutzt: 
Die Verwendung unsicherer Passwörter ist eine häufige Ursache für unbefugte Zugriffe. Weitere 
Probleme entstehen beispielsweise durch die Verbreitung von Fake News, durch Cybermobbing 
und ähnlichem. Auch Angriffe mittels >Social Engineering sollten nicht unterschätzt werden. 
Dabei werden der Nutzer oder die Nutzerin eines Systems durch psychologische Tricks dazu 
verleitet, selbst kompromittierende Handlungen auszuführen (wie z. B. die Installation von 
Schadsoftware, die Weitergabe von Zugangsdaten oder die Übertragung von Nutzerkonten). 
Das Internet spielt beim Social Engineering häufig eine wichtige Rolle, da es den Angreifern er- 
möglicht, unter falscher Identität Ziele auf der ganzen Welt anzugreifen. Oft geschieht dies mit 
betrügerischen E-Mails, bei denen Schadsoftware im Anhang z. B. als Rechnung getarnt an po- 
tentielle Opfer versendet wird. Ebenfalls gängig ist sogenanntes >Phishing bei dem die Opfer 
auf gefälschte Anmeldeseiten gelockt werden. Geben sie dort ihre Zugangsdaten ein, so landen 
diese unmittelbar bei den Angreifern. 


Die Vernetzung von technischen Geräten und deren Anbindung an das Internet eröffnet 
viele Chancen im privaten und beruflichen Umfeld. Beispielsweise bieten Clouddienste den 
Vorteil von weltweitem und verteiltem Zugriff auf Speicher- und Rechnerkapazität. Aber 
auch kriminelle Menschen profitieren vom Internet, indem sie Sicherheitslücken oder Feh- 
lerbeider Benutzung von Diensten fürihre Zwecke ausnutzen. Auftechnischer Seitekönnen 
beispielsweise Firewalls, Virenscanner, Sicherheitsupdates und Datenschutz-Einstellun- 
gen bei Browsern und Apps einen gewissen Schutz vor ungewollten Zugriffen bieten. Im 
Rahmen von Social Engineering werden aber auch menschliche Schwachstellen ausge- 
nutzt. Durch die Verwendung von sicheren Kennwörtern, Datensparsamkeit und Prüfung 
der Authentizität von Nachrichten kann die Sicherheit erhöht werden. 
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Aufgaben 


@ 1 Würmer, Viren und Trojaner 


Im Kontext von Schadsoftware, welche über das Internet ungewollt verschiedenste Geräte 

befallen kann, unterscheidet man oft zwischen Computerviren, Würmern und Trojanern. 

a Recherchieren Sie die Definitionen dieser Begriffe und grenzen Sie sie voneinander ab. 

b Recherchieren Sie ebenfalls die Definition des Begriffs „Botnet” und erläutern Sie, weshalb 
von dieser Konstellation eine besonders große Gefahr ausgehen kann. 


oO iii 2 Motive krimineller Handlungen und wie man sich dagegen schützt 


Kriminelle Handlungen im Internet lassen sich oft in eine der folgenden Kategorien einteilen: 

i eigentlich kostenpflichtige Leistungen kostenfrei erschleichen 

ii Schaden bei möglichst vielen unspezifischen Opfern anrichten 

iii größtmöglichen Schaden bei einem spezifischen Opfer anrichten 

iv geheime Informationen ausspähen 

a Versuchen Sie nachzuvollziehen, wie und warum es zu diesen Handlungen kommt und 
wie sich potentielle Opfer dagegen schützen können. Übernehmen Sie dazu die folgende 
Tabelle in Ihr Heft und vervollständigen Sie diese: 


| | Motivation Mittel und Wege Schutzmaßnahmen 


fremden Zugangsdaten 


i Finanzieller Vorteil | Phishing zur Erlangung von | von 


b Eine weitere Kategorie krimineller Aktivität im Internet umfasst die Verbreitung sog. „Ran- 
somware” (abgeleitet von englisch ransom für „Lösegeld“). Beschreiben Sie die Funktions- 
weise dieses Typs Schadsoftware allgemein und an einem konkreten Beispiel (ggf. nach 
einer kurzen Internetrecherche). 

c Diskutieren Sie in Kleingruppen die Wirksamkeit von Antivirensoftware, Firewalls und 
regelmäßigen Backups als Schutz vor einem Angriff mit Ransomware. 

d Vergleichen Sie Ihre Antworten für die Teilaufgaben a) und c) im Klassenverband und 
erstellen Sie gemeinsam eine Liste mit „best practices” für einen bestmöglichen Schutz 
gegen Angriffe aus dem Internet. 


= 3 IT-Sicherheitsvorfälle in den Medien 


a Suchen Sie in den Medien nach Berichten über IT-Sicherheitsvorfälle bei Unternehmen 
oder öffentlichen Einrichtungen. Versuchen Sie dabei herauszufinden: 
» Was war der Auslöser? 
* Welche unmittelbaren Folgen hatte der Vorfall? 
« Wurden Gegenmaßnahmen ergriffen, um ähnliche Angriffe zukünftig zu verhindern? 

Wenn ja, welche? 

b Diskutieren Sie, inwieweit die betroffenen Einrichtungen in Ihren Augen leichtfertig ge- 
handelt haben und durch nicht ausreichende Sicherheitsvorkehrungen eine Mitschuld 
am Sicherheitsvorfall tragen. 


& 4 DNS-Amplification-Angriffe 
Mittels des DNS-Protokolls können die zu einem Domainnamen gehörenden IP-Adressen er- 
mittelt werden. Die verbindungslose Kommunikation zwischen DNS-Client und -Server läuft 
dabei wie folgt ab: Der Client sendet ein wenige Byte großes Datenpaket mit seiner Anfrage 
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an den Server, welcher daraufhin ein Antwortpaket an die in der Anfrage enthaltene Absen- 

deradresse sendet. Die Antwort des Servers kann dabei unter Umständen mehrere Kilobyte 

umfassen. 

a DNS-Amplification-Angriffe gehören zu den Denial-of-Service-Angriffen. Dabei versucht 
der Angreifer die Erreichbarkeit seines Ziels (z. B. ein Webshop) für andere Nutzer zu ver- 
hindern. Beschreiben Sie, wie ein Angreifer vorgehen muss, um unter Ausnutzung des 
DNS-Protokolls einen Zielserver derart zu überlasten, dass dieser nicht mehr erreichbar 
ist. 

b Diskutieren Sie mögliche Gegenmaßnahmen, um einen Webserver vor den Folgen derar- 
tiger Angriffe zu schützen. 


5 Wireshark: Man in the Middle em O 
Öffnen Sie das Programm Wireshark und starten Sie eine neue Aufzeichnung. Wählen Sie dafür 
die Schnittstelle aus, über die Ihr Rechner mit dem Internet verbunden ist. Bearbeiten Sie 
anschließend die folgenden Teilaufgaben: 

a Führen Sie zunächst keine weiteren Aktionen am Rechner aus und beobachten Sie die 
Aufzeichnung des Datenverkehrs. Versuchen Sie Art und Ursprung der aufgezeichneten 
Datenpakete falls möglich zu identifizieren. 

b Öffnen Sie nun einen Webbrowser und rufen Sie eine Webseite Ihrer Wahl auf. Beenden 
Sie den Aufzeichnungsvorgang in Wireshark, sobald die Webseite vollständig geladen 
wurde. 

c Analysieren Sie den Wireshark-Mitschnitt unter der Annahme, dass dieser von einem bös- 
willigen Hacker oder Geheimdienst im Rahmen einer sogenannten Man-in-the-Middle- 
Attacke ohne Wissen des Opfers angefertigt wurde. Beurteilen Sie in diesem Kontext, 
welche Informationen über das Surfverhalten des Opfers durch das Mitschneiden des 
Datenverkehrs ermittelt werden können und welche Informationen auf diese Weise nicht 
einsehbar sind. Sammeln und diskutieren Sie Ihre Ergebnisse anschließend gemeinsam in 
der Klasse. 

d Vergleichen Sie Ihre Ergebnisse aus Teilaufgabe c) mit den Informationen, die durch eine 
Analyse des Datenverkehrs direkt mit den Entwicklerwerkzeugen im Browser ermittelt 
werden können (vgl. Einstiegsaufgabe des Kapitels). Formulieren Sie eine Vermutung, 
weshalb bestimmte Informationen nur bei Wireshark und wiederum andere nur mit den 
Entwicklerwerkzeugen im Browser angezeigt werden können. 


6 Schicht-8-Sicherheitslücken 8 
Obwohl das TCP/IP-Modell (vgl. 5.93) nur vier Schichten enthält und auch das ISO/OSI-Schich- 
tenmodell lediglich sieben Schichten vorsieht (mit Schicht 7 als Anwendungsschicht), findet 
man gelegentlich auch die Angabe, dass die Ursache eines Sicherheitsproblems auf Schicht 8" 
zu finden sei. Erläutern Sie, was mit dieser Beschreibung vermutlich gemeint ist. 


7 Schutzmechanismen im digitalen Alltag 8 
Beantworten Sie die folgenden Fragen ehrlich und reflektieren Sie am Ende, ob Sie den Schutz 
Ihrer persönlichen Daten erhöhen können. Sollten Sie auf eine der Fragen keine Antwort wis- 
sen, überprüfen bzw. recherchieren Sie, bis Sie die Antwort haben. 

a Haben Sie auf Ihrem Handy einen Virenscanner installiert? 

b Gibt es in Ihrem Heimnetzwerk eine Firewall? 

c Haben Sie mindestens eine zweite E-Mail-Adresse, die Sie bewusst bei Registrierungen 
einsetzen? 

d Verwendet der von Ihnen genutzte Messenger eine Ende-zu-Ende-Verschlüsselung? 

e Achten Sie bei der Eingabe von Nutzerdaten im Browser darauf, dass das Protokoll HTTPS 
verwendet wird? 
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f Beträgt die Standardlänge Ihrer Kennwörter über zehn Zeichen und enthalten sie Son- 
derzeichen? 

qg Verwenden Sie ein Kennwort mehrfach? 

h Haben Sie in Ihrem Browser und Messenger Ihre Datenschutzeinstellungen manuell 
überprüft und ggf. angepasst? 


Werbetracker entlarven 

Auf vielen kommerziellen Webseiten werden Analysewerkzeuge eingesetzt, um das Surfver- 

halten der Besucherinnen und Besucher aufzuzeichnen. Wird das Analysewerkzeug eines 

Anbieters auf verschiedenen Webseiten eingesetzt, so kann der Anbieter erkennen, welche 

dieser Webseiten ein Nutzer oder eine Nutzerin in welcher Reihenfolge und für wie lange 

besucht hat. Mittels einer entsprechenden Browsererweiterung können diese webseiten- 
übergreifenden Analysewerkzeuge aufgespürt und visualisiert werden. 

a Verwenden Sie einen Webbrowser mit aktivierter Analyseerweiterung und besuchen Sie 
verschiedene Webseiten Ihrer Wahl (z.B. Schulhomepage, Nachrichtenportale, etc.). 
Untersuchen Sie, welche externen Inhalte die verschiedenen Webseiten verwenden, und 
vergleichen Sie Ihre Beobachtungen mit denen von anderen. 

b Oft sind die Bereitsteller von Analysewerkzeugen auch Vermarkter von Werbeanzeigen 
im Internet. Erklären Sie, weshalb diese Werbevermarkter großes Interesse an Daten 
über das Surfverhalten der Webseitenbesucher haben. 

c Erläutern Sie an einem konkreten Beispiel, wie ein großer Werbevermarkter, dessen Ana- 
Iysewerkzeug auf sehr vielen populären Webseiten zum Einsatz kommt, intime Details 
über Ihr Leben in Erfahrung bringen kann. 


Feuerluchs blockierte 285 Skripte zur Aktivitätenverfolgung in der letzten Woche. 
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Sodal-Media-Tracker 


Metadaten 

Durch eine sichere Verschlüsselung, wie sie etwa bei HTTPS zum Einsatz kommt, wird es für 

potentielle Angreifer nahezu unmöglich, den Inhalt einer Datenübertragung mitzulesen. 

Neben den eigentlichen Nutzdaten (z.B. Inhalt einer besuchten Webseite) fallen beider Kom- 

munikation aber auch stets sogenannte Metadaten an. Dies sind Daten, welche den eigent- 

lichen Kommunikationsvorgang beschreiben oder einordnen (etwa Ort und Zeitpunkt der 

Kommunikation). 

a Erläutern Sie am Beispiel eines Webseitenabrufs mittels HTTPS, welche Metadaten ei- 
nem böswilligen Hacker oder Geheimdienst durch das Mitschneiden des Datenverkehrs 
trotz Verschlüsselung in die Hände fallen können. 

b Der ehemalige US-Geheimdienstchef Michael Hayden sagte im Jahr 2014,,We kill people 
based on metadata. Recherchieren Sie, in welchem Zusammenhang dieses Zitat ent- 
standen ist. 

c Diskutieren Sie in Gruppen, ob und wenn ja wie es möglich wäre, auch die Metadaten 
einer vertraulichen Kommunikation vor potentiell mitlesenden Dritten zu verbergen. 


Paper Days 
Bei vielen Abläufen im Berufsleben ist das Internet heute nicht mehr wegzudenken. Um 
dennoch für einen möglichen Ausfall der digitalen Infrastruktur gewappnet zu sein, gibt es 
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in manchen Firmen regelmäßig sogenannte Paper Days. An diesen Tagen soll sämtliche Ar- 

beit ohne digitale Hilfsmittel erledigt werden - als Übung für den Ernstfall, wenn es tatsäch- 

lich einmal zu einem Ausfall kommen sollte. 

a Stellen Sie sich einen solchen Paper Day für einen normalen Schultag sowie drei Berufe 
Ihrer Wahl vor und beschreiben Sie, welche Abläufe von einem Ausfall der digitalen 
Infrastruktur betroffen wären und wie dies kompensiert werden könnte. 

b Diskutieren Sie die Sinnhaftigkeit derartiger Paper Days für verschiedene Berufe oder 
Berufsgruppen. Beziehen Sie in Ihre Überlegungen neben der Eintrittswahrscheinlich- 
keit für einen Ausfall sämtlicher digitaler Infrastruktur auch die potentielle Schadens- 
höhe im Falle eines Ausfalls mit ein. 

c Für Firmen mit internetbasierten Angeboten als Kerngeschäft, wie etwa Onlinehändler 
ohne Ladenlokale, erscheint das Umstellen auf papierbasiertes Arbeiten als Vorsorge- 
maßnahme wenig sinnvoll. Entwickeln und beschreiben Sie alternative Vorsorgestrate- 
gien, mit denen sich diese Firmen vor Umsatzeinbußen im Falle eines Internetverbin- 
dungsausfalls schützen können. 


Forschungsauftrag: Datenspuren überall! 
Bei der Nutzung mobiler Endgeräte (Tablets, vernetzte Uhren und Fitnessgeräte etc.) fallen 
unterschiedliche Nutzungsdaten an. Der Hersteller des verwendeten Betriebssystems hat 
dabei in der Regel einen sehr umfassenden Zugriff auf die anfallenden Daten und kann so 
leicht verschiedene Nutzungsdaten verknüpfen. 
a Informieren Sie sich über ein mobiles Endgerät Ihrer Wahl (z. B. Ihr Smartphone): 
Welches Betriebssystem kommt auf dem Gerät zum Einsatz? 
Welche Nutzungsdaten werden vom Hersteller des Betriebssystems gesammelt 
(inkl. vom Hersteller bereitgestellter Apps)? 
Durch welche eindeutigen Schlüssel kann der Hersteller die anfallenden Daten 
verknüpfen und eindeutig einer Person bzw. einem Nutzerkonto zuordnen? 
Welche Möglichkeiten gibt es, die Weiterleitung dieser Nutzungsdaten 
einzuschränken? 
b Paul Maduschen war kürzlich in der Fußgängerzone, um in einer Parfümerie persönlich 
nach einem Valentinstagsgeschenk für seine Frau Isolde zu suchen. Nun bemerkt er, dass 
auf vielen Webseiten, die er besucht, Werbeanzeigen für Blumenläden eingeblendet 
werden. Erklären Sie, wie es dazu gekommen sein könnte und welche Daten dabei im 
Hintergrund verknüpft wurden. 
Beschreiben Sie verschiedene potentielle Vor- und Nachteile, die Nutzerinnen und Nut- 
zern entstehen können, wenn private Firmen Daten über sie sammeln und verknüpfen, 
sodass detaillierte Persönlichkeitsprofile entstehen. 
d Tauschen Sie sich mit anderen über diese Form der zielgerichteten Werbung aus. 

Haben Sie selbst bereits ähnliche Situationen erlebt? Wie denken Sie über diese Art 

der Werbung? Beziehen Sie auch politische Werbung in die Überlegungen ein. 


n 


#0 


(6) 
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Teste dich selbst 


T1 Richtig oder falsch? 
Beurteilen Sie, ob folgende Aussagen richtig oder falsch sind. Begründen Sie Ihre Meinung 
bei falschen Aussagen und geben Sie eine berichtigte Aussage an: 
a Die Kommunikation im Internet erfolgt oft nach dem Client/Slave-Prinzip. 
b Ein Switch kann mehrere Netze miteinander verbinden. 
c DNS steht für das Grundprinzip des Internets „do not suffer“. 
d Das Schichtenmodell teilt die Kommunikation im Internet in Ober- und Unterschicht. 
e IP-Adressen dienen zur eindeutigen Identifikation eines Rechners in einem Netz. 
f Cookies dienen dazu, Daten der Anwender besser zu schützen. 


T2 Ich check’s, dank deiner Hilfe! 
Ferdi hat im Unterricht nicht gut aufgepasst und braucht dringend Ihre Nachhilfe vor der 
alles entscheidenden letzten Prüfung. Helfen Sie ihm, indem Sie ihm die folgenden Begriffe 
an einem Beispiel erklären: 
Client/Server-Prinzip, Router, Switch, Schichtenmodell, Port, IP-Adresse, MAC-Adresse, 
Protokolle, Cookies 


T3 Kommunikation im Schichtenmodell 
a Geben Sie die vier Schichten des im Lehrtext erläuterten TCP/IP-Modells an. 
b Erläutern Sie kurz die Aufgabe jeder einzelnen Schicht. 
c Erklären Sie den Begriff Protokollstapel im Zusammenhang mit dem Schichtenmodell 
und geben Sie Beispiele für Protokolle an. 
d Geben Sie an, welche Adressen bei der Kommunikation im Schichtenmodell zur Identifi- 
kation in den einzelnen Schichten verwendet werden. 


T4 Protokolle 

a Geben Sie vier Beispiele für Protokolle an und erläutern Sie kurz, wozu diese eingesetzt 
werden. 

b Viele Protokolle, welche bei der Kommunikation im Internet verwendet werden, sind in 
frei zugänglichen Dokumenten standardisiert und beschrieben. Erläutern Sie die 
Vorteile, welche sich hieraus im Vergleich zu nicht standardisierten und nicht frei 
zugänglichen Protokollen ergeben. 

c Entwickeln Sie ein Protokoll, welches erlaubt, nur mit Klopfzeichen an eine geschlossene 
Tür aus einem Raum und dort hinein zu kommunizieren. Legen Sie dazu fest, wie die zu 
übertragenden Daten codiert werden, wie der allgemeine Ablauf einer Kommunikation 
ist und wie auf Fehler reagiert werden soll. Testen Sie das Protokoll anschließend. 


T5 Firewalls 
a Firewall kann wörtlich mit Brand(schutz)mauer übersetzt werden. Erläutern Sie die 
Bedeutung einer solchen Brandschutzmauer für die Kommunikation in Rechnernetzen. 
b Erklären Sie, was man darunter versteht, einen Port zu öffnen. 
c Finden Sie heraus, ob auf Ihrem Computer, Ihrem Handy, Ihrem Router und anderen 
Geräten eine Firewall installiert und aktiv ist. 
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Zusammenfassung a 


Zusammenfassung 


Aufbau des Internets 


Das Internet besteht aus der Verbindung von unzähligen kleinen, 
mittleren und großen Netzen. 


Router verbinden 
mehrere Netze und 
vermitteln in der 
Kommunikation zwi- 
schen diesen. Um einen 
Weg für Datenpakete 
zu finden, verwenden 
sie Routing-Tabellen. 


Switches verbinden 


mehrere Geräte zu Internet Service Provider stellen 
einem lokalen Netz. einen Zugang zum Internet bereit. 


Kommunikation im Internet 


Die Kommunikation zwischen Maschinen erfolgt oft nach dem Client/Server-Prinzip, bei welchem der 
Client die Kommunikation initiiert und der Server auf die eingehenden Anfragen wartet. Damit Maschinen 
erfolgreich Informationen austauschen können, müssen die Regeln für die Kommunikation in Protokollen 
eindeutig festgelegt werden. 


Für jede Schicht gibt Die Internet-Kommunikation wird in verschiedenen Für jede Schicht gibt es 
es unterschiedliche Schichten modelliert. Jede Schicht übernimmt eine unterschiedliche Protokolle. 
Adressen. Teilaufgabe des Prozesses. 


e——— 


Wichtige Protokolle 


- - logischer 
Da 
Transpontschich | | 

IP-Adresse |] Internetschicht f------------------.--- Internetschicht 


MAC-Adresse | | Netzzugangsschicht F---------------------- 


physikalischer Datenstrom 


HTTP(S) ımap  POP3 
NTP 


...und viele weitere 


1000Base-T (Kupferkabel) 
1000Base-SX/LX (Glasfaserkabel) 
IEEE 802.11 (Funk) 


Abrufen von Webseiten (HTTP/ HTTPS) 


Zum Abrufen von Webseiten im Internet wird in der Regel das Hypertext Transfer Protocol (HTTP) einge- 
setzt. Heutzutage wird die Kommunikation dabei zusätzlich verschlüsselt (HTTPS). Eine Identifikation von 
Nutzern über einzelne Anfragen hinweg wird durch die Verwendung von Cookies möglich. 


all 
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Zum Weiterlesen an 


Sehr vielmehr Möglichkeiten, einen Text auf einer Webseite zu gestalten, sind mit der Definition 
von Layouts in einer CSS-Datei (Cascading Style Sheet) gegeben. Ähnlich einer Formatvorlage 
wird dort mit Werten zu bestimmten Attributen das Aussehen eines Textes festgelegt. Dadurch 
kann gleichzeitig der Inhalt (Text) vom eigentlichen Design getrennt werden. HTML wird dann 
dazu verwendet, auf ein in einer CSS-Datei festgelegtes Layout zu verweisen. 


Zum Weiterlesen 


L3 Sprachen des Internets: HTML, CSS und Javascript 

Die ersten Webseiten wurden ausschließlich in der Auszeichnungssprache HTML (Hyper Text 
Markup Language) erstellt. Über HTML-Auszeichnungen können einzelne Bestandteile eines Tex- 
tes hinsichtlich ihres Aussehens (z. B. Schriftgröße, Absätze, Tabellendesign etc.) verändert wer- SIT EWEBSSTESETBETINTERZIHTE 
den. Auf dem Webserver wird die HTML-Datei gespeichert. Fragt ein Client mittels HTTP (oder 


CSS-Klassen sind 
<p class="einstieg" id="wWillkommen">Herzlich willkommen !</p> keine Klassen im 


HTTPS) beim Server an, so erhält er als Antwort den Inhalt der HTML-Datei. Der Browser kann Sinne der Objekt- 
orientierung! 


diese HTML-Auszeichnungen interpretieren und den Text passend darstellen. 
Die Darstellung des Absatzes ist in der 


<hl>Webseite über mich</h1> 17  h1 steht für eine Überschrift vom Typ 1. CSS-Klasse einstieg definiert. 


<p>Herzlich willkommen!</p> Seen steht für einen Absatz. — Ines 
p.einstieg { das Layout definiert. 


Website über mich Darstellung im Browser font-family: arial, sans-serif; Angaben können absolut 
Herzlich willkommen! margin-left: 2em; } (em oder px) oder relativ (%) 
ee — 


width: 20% gemacht werden. 


Autorenteam Doreen ep 20122 zei | Legt einen drei Pixel großen 
} und roten Rand für den Ab- 
Wir wünschen 
satz fest. 


Website über mich 


Darstellung im Browser 


Herzlich willkommen! 


Eine Webseite, die rein auf HTML (mit CSS) basiert, nennt man statisch. Jede Änderung in der 
Darstellung oder des Inhalts der Webseite erfordert eine Anfrage beim Server, welche dann er- 
neut den gesamten Inhalt der Seite an den Client senden muss. Das führt zu viel Datenverkehr 
zwischen Client und Server sowie zu einer hohen Auslastung des Servers. Auf der Benutzerseite 
kann es dabei zu Wartezeiten kommen. 


Heutzutage beinhalten moderne Webseiten dynamische Elemente. Diese verändern Teile der 


nn ac Prunz etungeniocki gen); «Johannen Noumayer Webseite bei einer Interaktion des Benutzers (z. B. Klick auf einen Button, Eingabe in einem Text- 
X ur didakltı € Oi N > - IC ntormalikı ic eiler 


htet Informatik im 


feld) scheinbar augenblicklich, ohne die gesamte Seite vollständig neu vom Server zu laden. Die 
Programmiersprache Javascript ermöglicht es, auf der Client-Seite Veränderungen an einer Web- 
seite vorzunehmen, ohne dass eine Anfrage an den Server gestellt werden muss. Javascript wird 
im Browser ausgeführt. Mit Javascript kann im Prinzip auf jedes Element einer Webseite zuge- 
griffen und dieses verändert werden. 


In einer Variable absatz1 Anhand der oben mit HTML festgelegten 
wird eine Referenz auf den ID kann der Absatz eindeutig im HTML- 
Absatz gespeichert. Dokument identifiziert werden. 


[ 


var absatzl = document .getElementById ("willkommen"); 


absatzl.style.backgroundColor = "red"; 


Stefan Seegerer arbe 
nach einer Promot 


Mittels Punktnotation wird die Hintergrundfarbe des Absatzes verändert. 
Website uber mich Darstellung im Browser nach 
Herzlich willkommen! | Ausführung der Javascript-Befehle 
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In der Entwicklung der Webseite wird die gewünschte Reaktion in Javascript programmiert. Bei 
der Ausführung der Seite kann dann auf Client-Seite die passende Funktion aufgerufen und 
ausgeführt werden. 

Javascript kann auch dazu verwendet werden, im Hintergrund eine sogenannte asynchrone An- 
frage an den Server anzustoßen. Asynchron bedeutet dabei, dass während des Wartens auf eine 
Antwort vom Server die Webseite nicht vollständig blockiert ist. Nach der Anfrage kann die Be- 
nutzerin bzw. der Benutzer die Seite weiter bedienen. Sobald die Antwort vom Server kommt, 
wird der zuvor durch die Entwicklerin bzw. den Entwickler definierte Javascript-Quelltextaus- 
schnitt ausgeführt. Für die Anwenderinnen und Anwender ist von dieser internen Anfrage nur 
etwas zu sehen, wenn sich nach der Antwort die Webseite sichtbar ändert. Bietet ein Webserver 
beispielsweise eine Suchfunktion und speichert er die letzten Suchanfragen, so kann diese Art 
der Kommunikation wie folgt eingesetzt werden: Bei einer Suchanfrage fragt der Client bereits 
nach dem Eintippen des ersten Buchstabens beim Server an, welche Vorschläge für die Suche in 
Frage kommen. Der Server vergleicht den vom Client gesendeten Buchstaben mit den Anfangs- 
buchstaben aus seiner Liste der letzten Suchanfragen und schickt anschließend beispielsweise 
die ersten zehn Vorschläge mit dem selben Anfangsbuchstaben. Der Client kann nun diese Vor- 
schläge in die Webseite einbinden und den Benutzerinnen und Benutzern sichtbar machen. Da 
nur sehr wenig Daten zwischen Client und Server ausgetauscht werden müssen, geht die Kom- 
munikation sehr schnell. Dadurch und weil nur einzelne Bestandteile der Webseite geändert 
werden, sieht es auf Benutzerseite so aus, als würde die Reaktion ohne Verzögerung erfolgen. 


Selber ausprobiert: HTML-Formatierung ändern 

Finden Sie mit den Entwicklertools Ihres Browsers die ID eines Menüpunktes auf iinformatikschul- 
buch.de. Orientieren Sie sich am Codebeispiel oben und versuchen Sie über die Konsole des 
Entwicklertools die Hintergrundfarbe des Menüpunktes zu ändern. Versuchen Sie auch andere 
Attributwerte (z. B. marginLeft, fontSize, ...) zu verändern. Warum gehen beim Neuladen der 
Seite die Änderungen wieder verloren? Nutzen Sie bei der Erklärung auch Ihr Wissen über das 
Client/Server-Konzept. 


L4 Surfen, Telefonieren, Fernsehen - alles über das Internet 

Bis in die 2010er Jahre waren in Privathaushalten üblicherweise nur Computer und vergleichba- 
re Geräte zum Surfen im WWW mit dem Internet verbunden. Das Fernsehsignal wurde über eine 
Antenne oder einen Kabelfernsehanschluss empfangen und zum Telefonieren stand ein separa- 
ter Festnetzanschluss zur Verfügung. Mittlerweile wandelt sich diese traditionelle Struktur mehr 
und mehr. Das Internet wird dabei zum zentralen Kommunikationsnetz, über das auch Telefon- 
verbindungen und Videoübertragungen abgewickelt werden. 


Da reine Sprechverbindungen nur wenig Übertragungsbandbreite benötigen, gab es 


Zum Weiterlesen 


Im Bereich der Mobilkommunikation hat sich etwa zeitgleich ein ähnlicher Wandel vollzogen. 
Auch hier war die Technik von Handys und der dahinterstehenden Netzinfrastruktur zunächst 
primär auf die Abwicklung von Telefongesprächen ausgelegt; der Zugriff auf das Internet war 
umständlich und nur als teurer und entsprechend wenig genutzter Zusatzdienst vorgesehen. 
Mittlerweile steht wegen der großen Verbreitung von Smartphones hingegen eindeutig die Nut- 
zung von Internetdiensten im Vordergrund, sodass die eigentlicheTelefonfunktion dieser Handys 
mehr und mehr an Bedeutung verliert. 

Auch der Empfang von Fernsehsendern ist seit längerem über das Internet möglich und wird 
allgemein als IPTV bezeichnet. Da beim klassischen Fernsehen das gleiche Fernsehbild gleichzei- 
tig an viele Empfänger übertragen wird, ergibt sich bei der Übertragung über das Internet schnell 
das Problem, dass fürjeden Empfänger eigene IP-Pakete mit dessen Empfängeradresse versendet 
werden müssten. Ein und dasselbe Fernsehbild müsste somit vielfach in identischer Form über- 
tragen werden. 


ohne Multicast: 


——— physikalische Leitung 


—— Datenstrom auf physikalischer 
Leitung 


Eine Lösung für dieses Problem bietet die IP-Multicast-Technik. Dabei werden die Daten einmalig 
vom Sender an einen speziell für diesen Zweck reservierten IP-Adressbereich gesendet. 


Potentielle Empfänger können den Empfang dieser Multicastpakete dann „abonnieren“, indem 
Sie ihrem Verbindungsrouter ihr Interesse an den Paketen dieser Multicast-IP-Adresse mitteilen. 
Eingehende Multicastdaten werden vom Router dann an alle interessierten Empfänger weiter- 
geleitet. 


Ironie der Geschichte: Bis in 


mit Multicast: 


die 2000er war es üblich, schon früh Bestrebungen, das Internet auch für die Übertragung von Telefongesprächen 
dass der Zugang zum Inter- zu nutzen. Dabei werden Sprachdaten über das im Internet verwendete IP-Protokoll über- 
nn tragen, deshalb spricht man häufig von IP-Telefonie oder auch VoIP (Voice over IP). Diese 
dagegen die Telefongesprä- Technik ist inzwischen so verbreitet, dass bei fast allen Telefonanschlüssen in Privathaus- 
che über eine Internetver- halten die Sprachdaten der Telefone zunächst digitalisiert und anschließend über einen 
bindung übertragen. Internetanschluss übertragen werden; „echte“ Telefonanschlüsse gibt es kaum noch. Für 
N 4 die Dienstanbieter ergibt sich dadurch in erster Linie der Vorteil, nicht mehr zwei getrenn- 
S te Infrastrukturen für die Vermittlung von Daten- und Sprechverbindungen betreiben zu 
müssen. 
—— physikalische Leitung 
—— Datenstrom auf physikalischer 
Leitung 
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4 Künstliche Intelligenz 


Ähnlich verhält es sich auch bei großen Videoportalen und Streamingdiensten. Auch hier wären 
die zentralen Verbindungsleitungen schnell überlastet, wenn alle Clients von einem einzelnen 
zentralen Rechenzentrum aus bedient würden. Allerdings kann in diesem Fall kein Multicast 
verwendet werden, da nicht alle Nutzer zeitgleich die gleichen Daten empfangen wollen. Statt- 
dessen kommen hier sogenannte Content Delivery Networks (CDNs) zum Einsatz. Dabei werden 
die Daten des Dienstanbieters auf vielen weltweit verteilten Servern zwischengespeichert, von 
wo aus sie von den Nutzern abgerufen werden können. Da sich die gewünschten Daten dann 
bereits in der Nähe der Nutzer befinden, werden Verzögerungen beim Abruf und die Belastung 


In diesem Kapitel erfahren Sie, ... 


Jetzt le: Identifizieren Sie der 
Computer mit Ihren Fragen. 


der globalen Internet-Verbindungsnetze minimiert. Im Grunde entspricht dies dem lang etab- ... was sich hinter dem Begriff künstliche si 

lierten Verfahren der klassischen Filmdistribution, bei dem die Filmstudios Kopien ihrer Filme an Intelligenz verbirgt. Hi, ich bin Dori. \ Du bist lustig. 

die lokal angesiedelten Kinobetreiber versenden, welche die Filme anschließend für die Öffent- Hallo, j Natürlich bin ich Ich weiß nicht mal, 

lichkeit verfügbar machen. bist du ein kein Computer. { Wie man die Dinger 
Computer? “ ) anschaltet. 


—— physikalische Leitung 


—— Datenstrom auf physikalischer 
Leitung 


or 


A 


cbeh 


neue Inhalte werden einmalig auf 
lokale Server überspielt 


... wie Maschinen lernen. 


Alles in allem hat sich das Internet seit der Jahrtausendwende mehr denn je zu einem universel- 
len Kommunikationsnetz entwickelt, über das beinahe jedes Medien- und Kommunikationsan- 
gebot realisiert werden kann. Hieraus ergeben sich aber auch Risiken. Zwar sind Totalausfälle des 
Internets aufgrund seiner verteilten und im Kern redundanten Struktur sehr unwahrscheinlich; 
käme es aber doch zu einem großflächigen Internetausfall in Deutschland, etwa durch eine Na- 
turkatastrophe oder auch durch einen Hackerangriff, so wären in den betroffenen Gebieten auch 
die IP-Telefonanschlüsse ohne Funktion und wohl auch große Teile des Handynetzes zunächst 
nicht verfügbar. Haushalte, in denen zusätzlich auch der Radio- und Fernsehempfang ausschließ- 
lich über das Internet erfolgt, hätten ineinem solchen Szenario dann kaum noch eine Möglichkeit, 
zeitnah aktuelle Nachrichten und ggf. wichtige Informationen des Katastrophenschutzes zu emp- 
fangen. Aber auch ohne Naturkatastrophen wird es zunehmend schwieriger, sich auch nur eine 
Woche ohne Internetzugang und die davon abhängigen Dienste auszumalen. 


rn EEE 


Wie wäre es mit 
... welchen Einfluss künstliche Intelligenz diesem Song? 
auf unser Leben hat. 
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Teen spa N 
Kl ist bereits seit 
über 70 Jahren ein 
Forschungsgebiet 
der Informatik. 
Stetig zunehmende 
Datenmengen, 
höhere Rechenleis- 
tung und bessere 
Werkzeuge haben 
die jüngsten Fort- 
schritte befeuert, 


& 
\V 


SMART HOME 


u9o°09o 


> Smart Home: 
technische Systeme 
in Häusern, die mit- 
tels Sensordaten und 
Einstellungen Akto- 
ren wie Lichter und 
Heizung über ein 
Programm steuern 


> lat. ratio: die Ver- 
nunft, der Verstand 
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4 Künstliche Intelligenz 


4.1 Der Mensch als Vorbild: Künstliche Intelligenz 


Alex ist begeistert von seiner Fotofilter-App: Das Programm 
sei ganz schön schlau, weil es beispielsweise Gesichter er- 
kennt. Er vermutet, dass das Programm künstliche Intelligenz 
verwendet. Susi ist da skeptischer: Sie sagt, das Programm 
würde nur markante Punkte auf dem Bild suchen und dort 


eine Maske darüberlegen. Das sei aber noch lange nicht intel- #) 
ligent. 


a Diskutieren Sie, ob die App „intelligent" ist. 

b Bewerten Sie die Intelligenz von mindestens zwei 
der im Downloadangebot genannten Anwendungen auf 
einer Skala von 1 (dumm) bis 10 (hochintelligent). 


Künstliche Intelligenz in Alltag und Film 

Roboter oder selbstdenkende Maschinen gibt es schon lange in Science-Fiction-Filmen oder 
-Büchern. Mittlerweile ist aber auch unser Alltag voll von intelligenten Softwareanwendungen, 
die in der Lage sind, Sprache zu erkennen oder qualitativ hochwertige Nachrichtentexte, Bilder 
oder Musikstücke zu erzeugen. Entsprechende Software bezeichnet man als künstliche Intelli- 
genz oder kurz Kl. Die Entwicklungen sind immer wieder verblüffend. So hätte man einem Com- 
puter Anfang der 2010er Jahre etwa die Erzeugung fotorealistischer Bilder noch nicht zugetraut. 


Was ist künstliche Intelligenz? 

Die Frage, was künstliche Intelligenz ist, lässt sich nicht einfach beantworten, weil es schon keine 
allgemein anerkannte Definition des Begriffs Intelligenz gibt. Folgende Definitionen zeigen ei- 
nerseits die verschiedenen Dimensionen des Begriffs, andererseits auch die Schwierigkeiten, ihn 
in einem Satz zu beschreiben. 


Autonome Fahrzeuge, die Hindernissen ausweichen, 
erfüllen diese Definition. Abhängig von der Problem- 
stellung kann dies im einen Fall durch einfachste elek- 
tronische Schaltungen ohne Steuerprogramm gesche- 
hen, im anderen Fall benötigt man modernste Sensorik 
in Kombination mit lernenden Algorithmen. 


„Bei künstlicher Intelligenz geht es 
darum, Maschinen zu entwickeln, 

die sich in einer Weise verhalten, dieman 
bei Menschen als intelligent bezeichnen 
würde.“- John McCarthy (1955) 


In vielen intelligenten Systemen wie 

>Smart Home sind diese drei Schritte _ 
umgesetzt, daher wirken sie für 

Beobachter autonom handelnd, 


Kl sind „Programme, die es ermöglichen, 
wahrzunehmen, logisch zu schließen und zu 
agieren.“ - Patrick H. Winston (1992) 


Hinter dieser Definition steht das Ziel, 
rational denkende Systeme zu schaffen, 
die stets nach bestem Wissen die optimale 
Option wählen. 


Kl ist „die Entwicklung mentaler 
Fähigkeiten durch die Nutzung von 
Computermodellen.“ - Eugene Charniak 
und Drew McDermott (1985) 


4.1 Der Mensch als Vorbild: Künstliche Intelligenz 


Hier sind die Anforderungen an eine Fa „Klist die Automatisierung von Aktivitäten, die wir 
Kl deutlich höher, spielen doch beim dem menschlichen Denken zuordnen, Aktivitäten wie 
menschlichen Denken z. B. auch beispielsweise Entscheidungsfindung, Problemlösung, 


Emotionen und >Intuition eine Rolle. Lemeni,..]= Richard Bellman (1978) 


„Klist die Wissenschaft, die der Frage Diese zeitlose Definition verdeutlicht, dass 
nachgeht, wieman Computer dazu bringen Pa sich die drängendsten Fragestellungen 
kann, Dinge zu tun, bei denen ihnen von Kl regelmäßig verändern und gelöste 


momentan der Mensch noch überlegen ist.” Probleme an Bedeutun g verlieren. 
- Elaine Rich und Kevin Knight (1991) 


Starke und schwache Kl 

Heutige Anwendungen künstlicher Intelligenz umfassen verschiedenste Facetten eigentlich 
typisch menschlicher Fähigkeiten. So wird bei virtuellen persönlichen Assistenten menschliches 
Denken nachgebildet oder bei der Routenplanung rationales Handeln durch den Computer 
umgesetzt. Aber alle diese Anwendungen künstlicher Intelligenz können ausschließlich eine 
bestimmte, vordefinierte Tätigkeit übernehmen wie Objekte auf Bildern zu erkennen, Nach- 
richtentexte zu schreiben oder Richterinnen und Richtern eine Bewährungsentscheidung zu 
empfehlen. Solche Anwendungen bezeichnet man als schwache Kl. Im Gegensatz dazu nennt 
man Anwendungen, die dem Menschen hinsichtlich aller seiner Fähigkeiten ebenbürtig sind 
oder ihn sogar übertreffen, Vertreter einer starken Kl. Solche Systeme gibt es (noch) nicht und 
sie sind deshalb nur in Science-Fiction-Filmen oder Büchern zu finden, wie z. B. >Vision und 
>Wall-E. 


Turing-Test 

Um eine tatsächlich überprüfbare Definition von der Intelligenz Computer , Mensch 
einer Maschine zu haben, schlug der Informatiker >Alan Turing 

bereits 1950 folgendes Verfahren vor: u) aD 


Ein Computerprogramm gilt als intelligent, wenn eine testende — 

Person es durch Beobachtung seines Verhaltens nicht von dem e E 
Verhalten eines Menschen unterscheiden kann. Dazu werden NY X 

ein Computer und ein Mensch in zwei getrennte Räume ge- aD 

bracht. Dietestende Person erhält die Aufgabe, herauszufinden, Tester 

in welchem Raum sich der Computer befindet. Hierzu kann er 

oder sie Fragen in die beiden Räume schicken. Um physische Merkmale wie Stimme oder Ausse- 
hen auszuschließen, erfolgt die Kommunikation schriftlich. Kann die testende Person den Com- 
puter nicht identifizieren, hat dieser den sogenannten Turing-Test bestanden und dessen Pro- 
gramm gilt als intelligent. 


Künstliche Intelligenz (Kl) beschreibt Programme, die menschliches Denken und Handeln 
nachahmen bzw. in der Lage sind, rational zu denken und/oder zu handeln. Eine allgemein- 
gültige Definition von Kl gibt es jedoch nicht. 

Alle heute existierenden Beispiele für Kl sind Vertreter der sogenannten schwachen Kl. 
Schwache Kl beschreibt Systeme, die nur eine bestimmte Aufgabe lösen können. Eine star- 
ke Kl hingegen würde über eine dem Menschen ebenbürtige Intelligenz verfügen oder 
diese sogar noch übertreffen. 

Der Turing-Test beschreibt ein Verfahren, bei der ein Computerprogramm so agieren muss, 
dass es für eine Fragen stellende Person nicht von einem echten Menschen unterscheidbar 
ist. 


del 


> Intuition 
beschreibt das 
Erkennen, Erfassen 
eines Sachverhalts 
oder komplizierten 
Vorgangs ohne 
bewusste, rationale 
Schlussfolgerungen. 


> Vision und Wall-E 
sind Figuren aus 
Avengers bzw. Wall-E. 


> Alan Turing 
(1912-1954), 
britischer Logiker, 
Mathematiker, 
Kryptoanalytiker 
und Informatiker. 


Schön, dass es mit 
dem Turing-Test 
ein Verfahren gibt. 
Aber alle Aspekte 
zur Intelligenz 


sind damit nicht 
abgedeckt. 
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dich 4 Künstliche Intelligenz 


Aufgaben 


ag! 


ag * 


Dag ° 
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Kl im Alltag 

a Notieren Sie (ohne Absprache mit anderen) auf Klebezetteln oder Karteikarten Anwen- 
dungen, bei denen Ihrer Meinung nach künstliche Intelligenz eingesetzt wird. 

b Gruppieren Sie nun die Ergebnisse aus a) gemeinsam nach Oberbegriffen wie Bildbear- 
beitung, autonome Systeme oder Ähnliches. 

c Stellen Sie Chancen und Risiken des Einsatzes einer Kl bei der Entscheidung, ob Verurteil- 
te auf Bewährung freigelassen werden sollen, gegenüber. 


Intelligente Software oder nicht? 

a Bewerten Sie die Intelligenz der im Downloadangebot genannten Anwendungen auf 
einer Skala von 1 (dumm) bis 10 (hochintelligent). 

b Begründen Sie knapp für ein Beispiel, weshalb es sich um eine schwache Kl handelt. 


Definitionen künstlicher Intelligenz 

Analysieren Sie die Definitionen der künstlichen Intelligenz aus dem Lehrtext auf S. 122f. 

wie folgt. 

a Think: Vergleichen Sie mindestens zwei Definitionen und beschreiben Sie Unterschiede 
und Gemeinsamkeiten. 

b Pair: Tauschen Sie Ihre Ergebnisse aus und diskutieren Sie, welche der Definitionen Ihrer 
Meinung nach am geeignetsten ist. 

c Share: Stellen Sie in knapper Form Ihr Ergebnis / Ihre Erkenntnis aus b) vor. 


Können Computer Texte schreiben? 

Unten finden Sie drei Textausschnitte abgebildet. Äußern Sie jeweils eine Vermutung, ob der 

Text von Menschen oder einem Computerprogramm verfasst wurde. Begründen Sie Ihre Ver- 

mutung. 

i FC Bayern Munich won against Augsburg with goals from Martinez and Alaba. Bayern Munich 
4:3 Augsburg: Bastian Schweinsteiger (30), Manuel Neuer (70), Javi Martinez (66), David 
Alaba (85) 

i The EU passed a law on Wednesday (17 April) that says people who are not citizens ofthe EU 
must still pay into the EU’s coffers to fund EU affairs, meaning that the EU tax-payer burden 
falls on the local population. 

iii Towering waves on Hawaii’s south shores crashed into homes and businesses, spilled across 

highways and upended weddings over the weekend. 


Menschliche versus künstliche Intelligenz 

Nach Wolfgang Wahlster kann man die menschliche Intelligenz in vier Bereiche unterteilen: 

die kognitive Intelligenz, die sensomotorische Intelligenz, die emotionale Intelligenz, die so- 

ziale Intelligenz. 

a Arbeiten Sie den Unterschied zwischen den einzelnen Bereichen durch je zwei Beispiele 
heraus. 

b Bewerten Sie für jeden Bereich, ob er durch Informatiksysteme nicht, schlecht, gut oder 
sehr gut umgesetzt werden kann. Begründen Sie Ihre Entscheidung. 
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4.1 Der Mensch als Vorbild: Künstliche Intelligenz 


Wettbewerb künstliche Intelligenz 

Der Loebner-Preis in Gold ist ein seit 1991 ausgeschriebener Preis, mit dem die Entwicklerin 

bzw. der Entwickler des ersten Computerprogramms ausgezeichnet werden soll, welches 

einem Turing-Test über 25 Minuten standhält. Bis 2022 wurde die „Goldmedaille“ noch nie 
vergeben. 

a Recherchieren Sie Anforderungen und Preisgelder der unterschiedlichen Kategorien. 

b Rufen Sie einen Chatbot auf. Unterhalten Sie sich mit dem Bot ca. 5 Minuten. Zitieren Sie 
aus der Unterhaltung einen Ausschnitt, der menschenähnliches Verhalten zeigt, und ei- 
nen Ausschnitt, der sehr deutlich macht, dass der Gesprächspartner ein Computerpro- 
gramm und kein Mensch ist. 


Das chinesische Zimmer 

Der Philosoph John Searle sah einen erfolgreich bestandenen Turing-Test nicht als Beweis 

für das Vorliegen von künstlicher Intelligenz an. Im Rahmen seiner Arbeit entwickelte er 

daher mit dem „chinesischen Zimmer” ein Gedankenexperiment, das sein Argument unter- 

mauern sollte. 

a Recherchieren Sie den Aufbau des Gedankenexperiments und notieren Sie die Kernaus- 
sage in einem Satz. 

b Diskutieren Sie, inwiefern John Searles Gedankenexperiment die Existenz starker Kl aus- 
schließt. 


Fiktion oder Realität 

Recherchieren Sie einen Science-Fiction-Film oder einen Roman, in dem eine künstliche 
Intelligenz ein zentraler Bestandteil der Handlung ist. Entscheiden und begründen Sie, ob es 
sich um eine starke oder schwache Intelligenz handelt. 


Automatischer Turing-Test: CAPTCHA 

Man kennt sie von den unterschiedlichsten Webseiten. Mal 17% 

gilt es, verzerrte Buchstaben zu entziffern, mal müssen Ob- Ss CN 
jekte auf einem Bild markiert, mal Bilder mit bestimmten 

Objekten ausgewählt werden: Captchas sind kleine Aufgaben, die verwendet werden, um 
festzustellen, ob die Webseite gerade von einem Menschen oder einem Computer besucht 
wird. 

a Recherchieren Sie die Bedeutung des >Akronyms CAPTCHA. 

b Recherchieren Sie Vor- und Nachteile des Einsatzes von Captchas. 

c Diskutieren Sie, inwiefern Captchas einen wirklichen Turing-Test darstellen. 


Langzeitauftrag: Aktuelle Berichte zu künstlicher Intelligenz 

Verfolgen Sie in den nächsten vier Wochen parallel zum Themenbereich Kl im Informatikun- 
terricht Artikel in Zeitungen bzw. Beiträge in den Nachrichten zu künstlicher Intelligenz. No- 
tieren Sie Thema, Datum, Quelle und bewerten Sie, ob positiv oder negativ über Kl berichtet 
wird. Spätestens am Ende des Kapitels wird diese Presseschau im Unterricht aufgegriffen. 


a 


ar yo 


20 


BO 


> Ein Akronym ist 
ein Kurzwort, das aus 
den Anfangsbuch- 
staben mehrerer 
Wörter gebildet wird. 


auf 
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dich 


EEE ETF 
Dieses Kapitel gibt 


einen Überblick 
über die Vielfalt 
von Kl und er- 
möglicht damit 
das Einordnen 
konkreter Systeme. 
Deine Lehrkraft 
wird eine Auswahl 
treffen. Vertieft 
wird in den 
folgenden Kapiteln 
das überwachte 
Lernen. 


Kin 
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4 Künstliche Intelligenz 


Bauernschach funktioniert ähnlich wie Schach: Jede Spielfigur wird 

wie ein Bauer bewegt, d.h. sie kann nur vorwärts gehen und gegne- 

rische Figuren nur diagonal schlagen (siehe Abbildung der Zugmög- 
lichkeiten der Roboterspielfiguren). Eine Seite gewinnt, wenn sie 

» eine eigene Spielfigur an das andere Ende des Spielfeldes führt 

» oder alle gegnerischen Spielfiguren schlägt 

- oder dafür sorgt, dass der Gegner in der nächsten Runde 
blockiert ist und keinen Spielzug mehr ausführen kann. 

a Öffnen Sie die Webseite und übernehmen Sie die Roboterfiguren. Wählen Sie in jeder 
Situation den Ihrer Einschätzung nach besten Zug aus. Spielen Sie anschließend meh- 
rere Runden und beurteilen Sie Ihre Gewinnchance. 

b Formulieren Sie als Bestandteil einer Kl für die Roboterfiguren zwei Regeln nach folgen- 
dem Muster: Wenn die Ausgangssituation „Einstein auf den Feldern 2, 3,4 und Roboter 
auf den Feldern 7, 8, 9” ist, dann ziehe Roboter von Feld 8 auf 4. 


Wie funktioniert künstliche Intelligenz? 

Schach spielen, Texte schreiben, Fragen beantworten, den Inhalt eines Bildes erkennen oder eine 
Route planen: So vielfältig wie die Aufgaben sind, die Kl bewältigen soll, so unterschiedlich sind 
die Herangehensweisen bei der Erstellung von Kl-Systemen. 


Wissensbasierte Ansätze 

Mit wissensbasierten Ansätzen wird versucht, Intelligenz durch die explizite Formulierung von 
Wissen, Regeln oder Strategien nachzuahmen. Die folgende Aufzählung zeigt verbreitete wis- 
sensbasierte Ansätze: 


» Tabellenbasiertes Wissen 


Gib mir die 
Vokabeltabelle, 

dann kann ich auch 
Wörter übersetzen. 


Ich kenne über 
3000 portugiesische 
Wörter. 


cachorro 


feira 


domingo 
esquerda 


amarelo 


Das Abrufen von Fakten ist hilfreich bei vielen Aufgaben wie dem Übersetzen von Wörtern, 
der Erklärung von Fachbegriffen oder Preisvergleichen. Auch die passende Aktion für eine 
gegebene Situation kann mithilfe einer solchen Tabelle ausgewählt werden. 


« Problemlösen durch Suche 
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Auch Suchstrategien können bei der Problemlösung helfen. Suchalgorithmen sind nicht nur 
bei derWegefindung in Navigationssystemen und Computerspielen zentral, sondern generell, 
wenn es darum geht, eine Abfolge von Schritten zu planen. Bei Spielen wie Schach kann ein 
KI-System dann etwa möglichst viele Züge im Voraus berechnen und nach der Aktion suchen, 
die die größte Gewinnwahrscheinlichkeit verspricht. 


4.2 Blick hinter die Kulissen: Wissens- und datenbasierte Ansätze 


« Entscheidungsbaum 


Bewerbungen werden 
bei uns über folgen- 
den Entscheidungs- 


Das kann 


baum abgelehnt ich einfach 
bzw. angenommen. über bedingte f 1 
Anweisungen 


umsetzen. 


falls Zeugnisschnitt > 2,5 

dann sendeAbsage () 

sonst 

falls hatFormaleFehler () 
dann sendeAbsage () 
sonst 

falls .. 


Bewerbungs- Warteliste 
gespräch 


Entscheidungsbäume werden beispielsweise bei Bewerbungsverfahren und Chatbots im Kun- 
denservice eingesetzt. Das Wissen basiert auf hierarchisch geordneten Regeln, die in einem 
Programm über bedingte Anweisungen gut abgedeckt werden können. 


* Logisches Schließen Nutzer 6) 


Ja, denn ein Enket 


ff ArSERr N 
Das logikbasierte 


Enkelkinder sind 
Kinder von Kindern! 
In meiner Familie 


kind ist ein Kind 
von einem Kind 
und weiterhin gilt: 


gibt es folgende 
Kinder ... 


Naomi ist ein Kind 
von Stefan und 

Stefan ist ein Kind 
von Lisa. 


%Fakten 
Naomi KIND VON Stefan 
Naomi KIND VON Miriam 
Stefan KIND VON Lisa 
David KIND VON Lisa 


%Regeln 
X ENKELKIND VON Y: X KIND 
VON K UND K KIND VON Y 


Expertenwissen kann auch über Fakten und Regeln in einer sog. Wissensbasis abgelegt wer- 
den.Mithilfe von Logik können die neuen Aussagen überprüft bzw. kombiniert werden. Solche 
Systeme werden beispielsweise beim Beweisen mathematischer Aussagen und zur Unterstüt- 
zung medizinischer Diagnosen verwendet. 


Grenzen wissensbasierter Ansätze 

Wissensbasierte Kl-Ansätze haben viel Potential, da u. a. Ergebnisse schnell und klar nachvoll- 
ziehbar geliefert werden. Allerdings haben sie auch ihre Grenzen: Selbst vermeintlich leichte 
Aufgaben wie das Erkennen von Hunden und Katzen auf Bildern sind durch die explizite Formu- 
lierung von Wissen, Regeln und Strategien - egal ob als Tabelle, Entscheidungsbaum oder Such- 
verfahren - kaum zu lösen: Es gibt zu viele Einflussfaktoren wie verschiedene Aufnahmewinkel, 
unterschiedliche Fellfarben oder verdeckte bzw. abgeschnittene Körperteile. In solchen Situati- 
onen werden datenbasierte Kl-Ansätze verwendet. 


del 


KI-System MYCIN 
gab bereits ab 
1972 basierend 
auf 450 Regeln 
Empfehlungen, 
ob bei einem 
bestimmten 
Krankheitsbild 
eine Behandlung 
durch Antibiotika 
erfolgen sollte. 


& 
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dich 


Wow, Entschei- 
dungsbäume gibt 


es bei wissens- 


basierten und 
datenbasierten 
Ansätzen. 


Auch beim Hunde- 
training wird 

mit Belohnung 
gearbeitet, um 

ein Verhalten zu 
erzielen. 


Da die Label der 
Eingaben bekannt 
sind, kann der 
Lernfortschritt 
kontrolliert, also 


überwacht, werden. 
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4 Künstliche Intelligenz 


Spielen Sie nochmals das Spiel Bauernschach, jedoch in einer anderen Variante: Sie führen 

diesmal die Einstein-Figuren. Die Züge der Roboter-Figuren werden durch eine Kl bestimmt. 

Die Kl Ihres Gegners nutzt nun eine andere Herangehensweise: Mit jedem Sieg bekommt 

Ihr Gegner nicht nur einen Gewinnpunkt, sondern erhält an geeigneter Stelle auch eine 

farbige Marke bzw. gibt bei jeder Niederlage eine Marke ab. 

a Spielen Sie gegen die Kl und beschreiben Sie, wie die Kl mithilfe von Belohnung und 
Bestrafung lernt, das Spiel zu spielen. 

b Für Schnelle: Diskutieren Sie zu zweit, inwiefern Sie das System anpassen müssten, 
damit es lernt, andere Spiele wie Vier Gewinnt oder Schach zu spielen. 


Datenbasierte Ansätze 

Bei datenbasierten Ansätzen werden die Entscheidungsregeln nicht vom Menschen festgelegt 
und implementiert, sondern basierend auf Daten erstellt bzw. schrittweise angepasst. Das Ge- 
lernte wird z. B. in einer Tabelle oder einem Entscheidungsbaum gespeichert. Nach Abschluss 
der Trainingsphase kann das Gelernte wie jedes andere Programm für neue Entscheidungen 
eingesetzt werden. Bei datenbasierten Ansätzen spricht man auch von maschinellem Lernen, 
wobei drei zentrale Arten unterschieden werden: 


u -System 
« Verstärkendes Lernen De ac-Tos 


Bei Spielen wie Tic-Tac-Toe kann zu spielen. 
verstärkendes Lernen eingesetzt Modell 
werden. Dabei lernt das System in - 
Interaktion mit seiner Umwelt 
durch wiederholte Belohnungen ’ 
oder Bestrafungen die Erfolgsaus- Aktion 


sichten seiner Aktionen besser wählen und 
durchführen 


einzuschätzen und somit seine xlOlxX Sieg |Belohnun 
Strategie zu optimieren. Im Bei- xoX x x101%X +1_Joder 5 
spiel rechts hat das Kl-System drei OXX X er 
Aktionsmöglichkeiten: Eine führt au 

gl |Niedertage 


Modell 
anpassen 


@ 
®) 


direkt zum Sieg, eine direkt zur 
Niederlage. Bei der letzten bleibt 
die Entscheidung über Sieg bzw. 
Niederlage noch offen und muss 
nach weiteren Aktionen entschie- 
den werden. Mit dem verstärkendem Lernen lassen sich auch Robotersteuerungen trainieren 
oder Optimierungsaufgaben lösen, wie das sinnvolle Schalten von Ampeln für einen möglichst 
hohen Verkehrsfluss. 


- Überwachtes Lernen 

Beim überwachten Lernen ist das Ziel, jedem Datum (Singular von Daten) ein Label zuzuord- 
nen. Ein Label ist der Wert eines (Ziel-Jattributs, z. B. ob ein Tumor gut- bzw. bösartig ist oder 
welcheTierart bei einer fest vorgegebenen Auswahl (z.B. Katze und Hund) abgebildet ist. Zum 
Lernen erhält das KI-System Daten mit korrekt zugeordneten Labeln als Eingabe. Im zweiten 
Schritt findet die Kl eine Zuordnung zwischen Daten und deren gegebenen Labeln. 

Die gefundene Zuordnung kann dann auf neue Eingaben angewendet werden. Typische An- 
wendungsbereiche von überwachtem Lernen sind auch die Erkennung von Gesprochenem 
oder die maschinelle Übersetzung von Texten. 


4.2 Blick hinter die Kulissen: Wissens- und datenbasierte Ansätze 


KI-System 
lernt, Hunde und 
Katzen zu erkennen. 


Daten mit Labeln als 
Eingabe erhalten 


gefundene Zuordnung 


Zuordnung von Daten 
auf neue Daten anwenden 


zu Labeln finden 


« Unüberwachtes Lernen 


Stehen lediglich Daten ohne Label als Eingabe zur Verfügung, so kann unüberwachtes Lernen 
angewendet werden. Ein unüberwachtes Lernverfahren identifiziert Ähnlichkeiten und Mus- 
ter in den Eingabedaten selbstständig, etwa um die Daten zu gruppieren oder >Ausreißer zu 
finden. So kann ein Kl-System Filme empfehlen, die Personen mit ähnlichem Filmgeschmack 
gefallen haben, und auch das Erkennen von Auffälligkeiten im Betrieb von Maschinen oder 
im Zahlungsverkehr ist so möglich. 


Mara und Elin Dario und Karl bewerten fETi 
bewerten 3 Filme gleich. 2 Filme gleich 


KI-System 
lernt, welche 
Nutzer ähnliche 


Be, Mara 
JPreetl | GE 9 IE 


7 
Ähnlichkeiten erkennen Gruppen und 


Eingaben ohne 
und Muster finden Ausreißer identifizieren 


Label erhalten 


Kombinierte Verfahren 

Im Jahre 2015 gewann ein Kl-System erstmals gegen einen Profi im Spiel 
Go. Hier wurde das Problemlösen durch Suche mit verstärkendem und 
überwachtem Lernen kombiniert. So konnte sowohl ein Teil der Züge 
vorausberechnet werden als auch das Kl-System die Bewertung von 
Spielsituationen lernen. Das Beispiel zeigt, dass in Kl-Systemen häufig 
mehrere unterschiedliche Verfahren kombiniert werden, um Probleme zu lösen - ein Vorgehen, 
das auch für Menschen typisch ist. 


Es gibt viele verschiedene Möglichkeiten Kl zu realisieren: Bei wissensbasierten Ansätzen 
werden (Experten-)Wissen, Regeln oder Strategien z.B. in Tabellen und Entscheidungsbäu- 
men gespeichert und angewendet bzw. gesucht. Datenbasierte Ansätze nutzen hingegen 
Datenbestände, um selbst z. B. Regeln für Label, Gruppierungen in den Daten oder vorteil- 
hafte Aktionen zu finden. Man spricht daher auch von maschinellem Lernen. 


del 


Das Speichern der 
gefundenen Zuord- 
nungsregeln kann 
sehr unterschiedlich 
umgesetzt werden. 
Mehr dazu in den 


folgenden Kapiteln. 


> Einzelwert, der 
von den übrigen 
Werten in auffälliger 
Weise abweicht 


Go gilt als 
wesentlich 
komplexer 

als Schach. 

Es gibt dort 
mehr mögliche 
Spielstellungen 
als Teilchen im 
Universum. 
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Aufgaben 


a, & 1 Wissenstest Autokennzeichen 

Ein beliebtes Spiel mit Kindern bei langen Autofahrten ist das Kürzelraten. Ziel ist es, möglichst 
vielen Ortskürzeln den richtigen Ort zuzuordnen. Programmieren Sie ein Kl-System, das zu 
allen Ortskürzeln eine Antwort geben kann. In der Vorlage ist das Wissen in Form einer Tabel- 
le bereits enthalten. Als Hilfestellung gibt es auch Blöcke, die zeigen, wie man auf einzelne 
Zellen der Tabelle zugreifen kann. 


So + 2 Einladung zum Bewerbungsgespräch 

Implementieren Sie eine Methode, die über bedingte Anweisungen den Entscheidungsbaum 
zur Bewerbungsauswahl aus dem Lehrtext umsetzt. Achten Sie auf geeignete Parameter. 
Für Schnelle: Welche Kriterien finden Sie wichtig? Erstellen Sie einen eigenen Entscheidungs- 
baum. 


\w) a. 3 Mondzauber, ein Logikrätsel (Informatik Biber 2019) 

Der weise Anaxagoras besitzt Mondzauberkarten, die für 

jedes ihrer neun Felder nach einer festen Regel funktionie- 

ren. Bei zwei Karten gibt er in jedes Feld ein Mondsymbol 

ein: Neumond (schwarz) oderVollmond.Soforterscheinen 

auch Mondsymbole auf einer dritten Karte. (siehe Beispiel 

rechts) 

a Nennen Sie für das zweite Beispiel zu jedem der Felder 2 bis 9, ob dort nach der Regel ein 
Voll- oder Neumond erscheinen muss. 

b Formulieren Sie knapp die Regel. 


+ 4 Komplexität bei Brettspielen im Vergleich 
Bei Bauernschach ist die Anzahl der Möglichkeiten begrenzt. So können für ein Spielfeld der 
Größe 3x3 insgesamt lediglich 37 unterschiedliche Spielstellungen erreicht werden. Mit zu- 
nehmender Komplexität des Spiels steigt jedoch auch die Anzahl der Möglichkeiten - einer 
der Gründe, warum Spiele wie Go lange Jahre als sehr komplex galten. 
a Bestimmen Sie näherungsweise, wie viele mögliche Spielsituationen sich bei den folgen- 
den Spielen ergeben. 
i 4x4 sowie 5x5 Bauernschach unter der vereinfachenden Annahme, dass auf jedem 
Feld eine der Situationen (Einsteinfigur, Roboterfigur, leeres Feld) zutreffen kann. 
ii Schach unter der Annahme, dass auf jedem der 8x8 Spielfelder eine der 12 unter- 
schiedlichen Spielfiguren stehen kann (ohne Unterscheidung der Läufer). 
iii Go unter der vereinfachenden Annahme, dass jedes der 19x19 Felder leer, mit einem 
schwarzen oder weißen Stein belegt sein kann. 
b Nehmen Sie an, dass zum Laden und Bewerten einer Spielsituation fünf Operationen nö- 
tig sind. Gehen Sie weiterhin davon aus, dass ein Prozessor passend zur Taktrate von 
5 GHz etwa 5-10? Operationen pro Sekunde ausführt. Schätzen die Zeit ab, die der Prozes- 
sor für die Entscheidung eines Spielzugs in den Fällen i, ii bzw. iii benötigt unter der An- 
nahme, dass 10% aller Spielzüge evaluiert werden müssen. 


N 


[6) & 5 Ideen des maschinellen Lernens bei Menschen 

Verstärkendes, überwachtes und unüberwachtes Lernen sind gar nicht so weit weg von der 
Art, wie Menschen lernen. Nennen Sie Beispiele, in denen Menschen und insbesondere Klein- 
kinder auf ähnliche Weise lernen. 
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4.2 Blick hinter die Kulissen: Wissens- und datenbasierte Ansätze 


Überwachtes Lernen: Bilderkennung 28 
Systeme zur Bilderkennung werden meist über vorab gesammelte und gelabelte Daten über- 
wacht trainiert. Da hier oft ähnliche Schritte zu erledigen sind, gibt es Werkzeuge, die diese 
Arbeit vereinfachen. 
a Öffnen Sie ein solches Werkzeug und führen Sie das Training für zwei Objekte Ihrer Wahl © 
mit den gegebenen oder eigenen Bildern durch. 
b Testen Sie Ihr Bilderkennungssystem anschließend mit weiteren Bildern. Variieren Sie da- 
bei beispielsweise Hintergründe und Rotationsrichtung. Äußern Sie bei fehlerhaften Vor- 
hersagen Vermutungen über mögliche Ursachen. 
c Sammeln Sie basierend auf Ihren Vermutungen aus b) weitere Daten, führen Sie das Trai- 
ning erneut durch und prüfen Sie schließlich, ob diese Bilder nun ebenfalls richtig erkannt 
werden. 


*7 Verstärkendes Lernen: Ein Affe lernt springen (aus SnAlp) 


”8 


Mit genau demselben Prinzip, mit dem der Computer 77 

selbstständig gelernt hat, Bauernschach zu spielen, lässt 

sichaucherlernen, einfacheVideospiele zu spielen.Inder 

Bananenjagd soll das Äffchen lernen, über anrollende 

Fässer zu springen. 

a Die Vorlage enthält bereits alle relevanten Blöcke, 
allerdings müssen diese noch passend verbunden 
werden. Orientieren Sie sich am Schaubild zu verstär- 
kendem Lernen (Seite 128) und fügen Sie die Blöcke 
richtig zusammen. 

b Das Gelernte wird in einer Tabelle gespeichert. Inspizieren Sie die Tabelle mithilfe des 
gegebenen Blocks und beschreiben Sie, wie sich die Werte innerhalb der Tabelle während 
des Trainings verändern. 

c Übertragen Sie die Idee auf das Spiel Pong und spielen Sie gegen Ihre Kl. 


Unüberwachtes Lernen (aus SnAlp) ii oR 3 

Unüberwachtes Lernen wird insbesondere für dasIdentifizieren von Gruppen oder Ausreißern 

eingesetzt. In dieser Aufgabe werden Sie mit derVektorquantisierung ein unüberwachtesLern- 

verfahren kennenlernen. Arbeiten Sie zu zweit. 

a Zeichnen Sie auf eine DIN-A4-Seite im Querformat ein Koordi- 
natensystem und verteilen Sie 25 Punkte so, dass drei Grup- 
pen erkennbar sind (siehe Bild für ein Beispiel). Notieren Sie 
die Koordinaten auf Karteikarten oder kleinen Zetteln. Geben 
Sie diese Karten dann an Ihre Partnerin/Ihren Partner. 

b Nehmen Sie die Karten entgegen und legen Sie diesen Stapel umgedreht neben sich hin. 
Verteilen Sie drei Münzen (oder andere ähnlich große Objekte) auf Ihrem Koordinatensys- 
tem. Ziehen Sie nun nacheinander Karten vom Stapel und verarbeiten Sie jede Karte wie 
folgt: 

1. Finde die nächste Münze. 
2. Bewege die nächste Münze die halbe Distanz in Richtung der Koordinaten auf der 
Karte. 

c Vergleichen Sie Ihre Lösung mit der Lösung Ihrer Partnerin/Ihres Partners. Entwickeln Sie 
anschließend gemeinsam zwei Verbesserungen für diesen Algorithmus. Führen Sie den 
Algorithmus erneut durch, um Ihre Verbesserungen zu testen. 


131 
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Von den Nachbarn lernen: Überwachtes Lernen 
umsetzen 


4.3 Alternative 1 


Amelie betreibt ein kleines Eiscafe. Sie stellt fest, dass 
die Lust auf Eis je nach Temperatur und Luftfeuchtig- 
keit stark unterschiedlich ist. Diese Erkenntnis will sie 
nutzen, um die Menge an Eis abzuschätzen, die sie 
produzieren muss. Dazu erfasst sie an 15 zufällig aus- 
gewählten Tagen Temperatur, Luftfeuchtigkeit und, 
ob kein, wenig oder viel Eis konsumiert wurde. Ihre 
Daten trägt sie in ein Koordinatensystem ein. 

Geben Sie an, wie viel Eis Amelie an den Tagen T1 und T2 produzieren sollte. Beschreiben 
Sie Ihr Vorgehen bei der Entscheidungsfindung. 


Temperatur in °C 


Irr@kein Eis 
Luftfeuchtigkeit in % 


k-Nächste-Nachbarn 


zu beschriftender Der k-Nächste-Nachbarn-Algorithmus ist ein über- 


N 
> Numerische Daten = Datenpunkt wachtes Lernverfahren, das aus >numerischen Daten 
können durchZah- = ö o mit bekannten Labeln lernt, neuen Daten jeweils eines 
‚Ienwerteausge- =| © eo. ® der bekannten Labels zuzuordnen (Klassifikation). Da- 
drückt werden, z.B. ® ie eo d die Label ei besti ten Anzahl 
Alter, nicht aber die ae zu werden die Label einer bestimmten Anza von 
Telefonnummer. © R i=f A nächsten Nachbarn - Parameterk-betrachtet undeine 
® . Mehrheitsentscheidung gefällt. 
Da das Lernen Merkmal 1 


lediglich aus 

dem Abspeichern 
der verfügbaren 
Daten besteht, 
spricht man auch 


von einem „lazy 
learner“ (faulen 


L 


erner). 


> Einzelwert, der 
von den übrigen 


Werten in auffälliger 
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Weise abweicht. 


Wie lernt ein KlI-System mit dem k-Nächste-Nachbarn-Algorithmus aus Daten? 

Um mithilfe des k-Nächste-Nachbarn-Algorithmus Vorhersagen treffen zu können, muss das KI- 
System lediglich die zur Verfügung stehenden Daten abspeichern. Dabei wird jeder Datenpunkt 
durch seine Koordinaten beschrieben. Die Bestimmung des Labels eines neuen Datenpunkts 
läuft anschließend wie folgt ab: 


1 Berechnen der Abstände des 2 Bestimmen der nächsten 3 Entscheidung über Label via 


neuen Datenpunkts zu allen Nachbarn (NN) Mehrheitsentscheidung 
anderen Punkten 
7 
S ”% 0 
BE % Sa 
5 13,8 — Erster NN @ 2  Derneue Datenpunkt 
= 22,1 — Zweiter NN @ 1- erhält das häufigste 


29,2 — DritterNN —> e ı Label.@® 
38,5 — Vierter NN 


4673’ 2, FÜNNIERNN Je nach Wahl von k werden 


die nächsten k Nachbarn 
berücksichtigt (hier: k = 4). 


Merkmal 1 


Ein neuer Datenpunkt erhält also das Label, das in seiner Nach- 
barschaft am häufigsten vorkommt. Sind mehrere Label gleich 
häufig (wäre im Beispiel oben bei k = 5 zutreffend), dann wird 
das Label zufällig gewählt. Entscheidend für die Vorhersagequa- 
lität ist die richtige Wahl von k, die in der Praxis stets vom zu lö- 
senden Problem und den gegebenen Daten abhängt. Bei zu 
kleinem k könnten >Ausreißer das Ergebnis beeinflussen. Ist k 
zu groß, könnten zu viele Datenpunkte mit unpassendem Label 
für die Entscheidung berücksichtigt werden. 


> 


Merkmal 2 


Merkmal 1 


4.3 Alternative 1 Von den Nachbarn lernen: Überwachtes Lernen umsetzen 


Der k-Nächste-Nachbarn-Algorithmus ist ein überwachtes Lernverfahren, das für einen 
Datenpunkt unter Berücksichtigung seiner k nächsten Nachbarn ein Label vorhersagt. 


Aufgaben 


1 Metriken und Abstände 

Wie nah sich zwei Punkte sind, kann auf unter- 

schiedliche Weise bestimmt werden. In dieser Auf- 

gabe werden Sie die verschiedenen Möglichkeiten 
kennenlernen. 

a Zeichnen Sie auf einem karierten Blatt ein Koor- 
dinatensystem mit der Einheit 1 cm und tragen 
Sie dort die drei Punkte P(2|8), Q(6|12) und 
R(2|14) ein. Bestimmen Sie nun den Abstand 
von Pzu Q und R, indem Sie ein Lineal verwen- 
den. Nennen Sie den nächsten Nachbarn zu P. 

b Der mit dem Lineal gemessene Abstand lässt 
sich auch rechnerisch bestimmen. Nutzen Sie 
den Satz des Pythagoras, um auf Basis der x- 
und y-Koordinaten die beiden Abstände zu bestimmen. Dieses Abstandsmaß nennt man 
auch den euklidischen Abstand (grüne Linie). 

c Eine weitere Möglichkeit ist es, die Kästchenkanten zu zählen, die zwischen den beiden 
Punkten liegen (blaue Linie). Dieses Abstandsmaß hat seinen Namen von dem schach- 
brettartigen Straßennetz Manhattans und heißt daher Manhattan-Distanz. Bestimmen 
Sie wieder den Abstand von Pzu Q und R und danach den nächsten Nachbarn von P. 


-— Manhatten-Distanz 


— euklidischer 
Abstand 


2 Rollenspiel zu k-Nächste-Nachbarn 
Zeichnen Sie mit Kreide ein Koordinatensystem mit den beiden Achsen „Körpergröße“ und 
„Anzahl der Stifte in der Schultasche“ auf den Schulhof. Acht Freiwillige stellen sich entspre- 
chend auf. Eine neunte freiwillige Person positioniert sich und sagt ihr Geschlecht anhand 
ihrer i2 ii4 iii 8 nächsten Nachbarn vorher. 


3 Richtig oder falsch? 

Entscheiden Sie, ob die folgenden Aussagen richtig oder falsch sind. Korrigieren Sie falsche 

Aussagen. 

a Der k-Nächste-Nachbarn-Algorithmus gilt als fauler Lerner („lazy learner“), weil er den 
Trainingsprozess häufig wiederholen muss. 

b Je größer der Parameter k gewählt wird, desto besser werden die resultierenden Vorher- 
sagen. 

c Der k-Nächste-Nachbarn-Algorithmus ist ein wissensbasierter Ansatz (für Kls). 

d Sind den Datenpunkten nur zwei Labels zuzuordnen, können Zufallsentscheidungen ver- 
mieden werden, indem für den Parameter k eine ungerade Zahl gewählt wird. 


del 


EenD 
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°O @ 4 Neues Haus (Biber-Wettbewerb 2020) 


> „Shitstorm“: Eine 


gro 


ße Zahl negativer 


Äußerungen, die das 
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Image nachhaltig 
beeinflusst. 


*2 


In einem Dorf werden alle Häuser entweder blau oder rot angestrichen. Um über die Farbe 
eines neuen Hauses zu entscheiden, haben die Bewohner eine Zahl k und diese Regel festge- 


legt: 

Ein neues Haus muss die Farbe bekommen, welche = n 

die Mehrheit der k nächstgelegenen Häuser hat. ” n 

Wenn es keine Mehrheit gibt, entscheidet die Mehr- e m Wr er: 

heit der k + 1 nächstgelegenen Häuser. Nun wurde 

wieder ein neues Haus gebaut. = e Pr 

Das Bild zeigt die Lage aller Häuser im Dorf. Die . 

Regel entscheidet, dass das neue Haus die Farbe Rot v M Blaues Haus 

bekommt. m Rotes Haus 
A Neues Haus 


Nennen Sie die kleinste Zahl kk, diezu dieser Entschei- 
dung führt, und begründen Sie Ihre Antwort. 


Computer als Werkzeug: k-Nächste-Nachbarn anwenden 

Das bereitgestellte Video zeigt Ihnen, wie man mithilfe eines Programms neue Datensätze mit 
Hilfe des k-Nächste-Nachbarn-Algorithmus klassifizieren kann. Führen Sie die im Video gezeig- 
ten Schritte für folgende Datensätze durch: 

a T-Shirt-Größen 

b Lebererkrankungen 

Nennen Sie fürk=2,4 und 6 jeweils die Erfolgsquote für die gegebenen zusätzlichen Beispiele. 


Computer als Werkzeug: k-Nächste-Nachbarn zur Sentiment-Erkennung 

Auch Texte können mithilfe des k-Nächste-Nachbarn-Algorithmus klassifiziert werden. Das 

möchte sich eine Firma zunutze machen und ein Frühwarnsystem für mögliche >,Shitstorms” 

entwickeln. Dazu sammelt sie Feedback (sog. Sentiments) zu sich und der Konkurrenz in So- 
cial-Media-Kanälen und labelt diese als „positiv“, „negativ“ oder „neutral“. Ihre Aufgabe ist es 
nun, die Firma dabei zu unterstützen, ein Modell zu entwickeln, das in der Lage ist, auch neue 

Beiträge automatisch entsprechend zu labeln. 

a Die Texte wurden bereits von Satzzeichen, störenden Zeichen und Wörtern wie „und” so- 
wie „also“ befreit, die für die Bestimmung des Sentiments nicht entscheidend sind. Da der 
k-Nächste-Nachbarn-Algorithmus nur mit Zahlen, nicht aber mit Texten umgehen kann, 
müssen Sie den Text noch in eine Liste von Zahlen umwandeln. Eine gängige Möglichkeit 
ist es, eine geordnete Liste / ein geordnetes Feld aller vorkommenden Wörter zu pflegen. 
Für einen gegebenen Text wird für jedes vorkommende Wort an der entsprechenden Stel- 
le eine 1 eingetragen. In dem Softwarewerkzeug steht dafür das Widget „Bag of Words“ 
zur Verfügung. Wenden Sie das Widget „Bag of Words” auf die gegebenen Eingabedaten 
an. 

b Nutzen Sie das k-Nächste-Nachbarn-Widget, um ein Modell zu erzeugen. Testen Sie Ihr 
Modell anschließend mit eigenen Posts. 


k-Nächste-Nachbarn allgemein implementieren 
Der k-Nächste-Nachbarn-Algorithmus lässt sich mit unterschiedlichen Werkzeugen umsetzen. 
Die Teilaufgaben hier führen Sie bei der Umsetzung mit einer Programmiersprache. 


4.3 Alternative 1 


*8 


10 


Von den Nachbarn lernen: Überwachtes Lernen umsetzen 


a Analysieren Sie die Vorlage, in der Daten zufällig erzeugt und dargestellt werden. Be- & 
gründen Sie, warum Anzahl der Wiederholungen und Zufallsbereiche unterschiedlich 
gewählt sind. 

b Ein wichtiger Bestandteil des k-Nächste-Nachbarn-Algorithmus ist eine Methode zur 
Bestimmung des Abstands zwischen zwei gegebenen Punkten (x, | y,) und (x; | y>). 
Implementieren Sie eine solche Methode und verwenden Sie dabei den euklidischen 
Abstand d= \ (x;-x1)? + (y2- yYı)?. 

c Implementieren Sie eine Methode, die für einen neuen Datenpunkt alle Entfernungen 
zu den Daten aus a) speichert und der Reihe nach sortiert. Dabei darf auch nach dem 
Sortieren die Zuordnung der Entfernung zum entsprechenden Punkt nicht verloren 
gehen. Testen Sie die Methode geeignet. 

d Vervollständigen Sie nun Ihr Programm zum k-Nächste-Nachbarn-Algorithmus. Das 
Schaubild im Lehrtext mag gegebenenfalls eine Hilfe sein. Testen Sie das Ergebnis. 


Implementierung des k-Nächste-Nachbarn-Algorithmus anwenden 
Ziel dieser Aufgabe ist das Anwenden der Lösung aus Aufgabe 7 auf Datensätze mit Infor- 
mationen zum Alter, dem Monatseinkommen und Beschäftigungsarten „angestellt“, „Mini- 
job” bzw. „selbstständig“ als Label. 
a Analysieren Sie die gegebenen Daten. Begründen Sie, warum bei der Abstandsberech- 
nung das Attribut Monatseinkommen deutlich mehr Einfluss hat als das Alter. 
b Damit beide „Koordinaten“ bei der Abstandsberechnung den gleichen Einfluss haben, 
müssen die Werte x entsprechend der folgenden Formel standardisiert werden: 
X Xmin 


X an 
standardisiert E 
Xmax Kmin 


2 
[07 


+08 


Erweitern Sie das Programm aus Aufgabe 6 um eine Methode, die für alle Datensätze vor 
der Berechnung der Abstände eine Standardisierung (hier für das Alter und das Monats- 
einkommen) durchführt. Beschreiben Sie, in welchem Bereich sich die standardisierten 
Werte befinden. 

c Wenden Sie mit Ihrem Programm den k-Nächste-Nachbarn-Algorithmus auf den Daten- 
punkt (35 Jahre | 6000 €) mitk= 2,4 und 6 an. 


Amelies Eisverkauf 

Amelie möchte den Bedarf für ihr Eiscafe (siehe Einstiegsaufgabe) noch genauer ermitteln. 
Dazu notiert sie für jeden Datenpunkt, der aus der Temperatur in °C und der Luftfeuchtigkeit 
in % besteht, die exakt verkaufte Eismenge und nicht mehr nur, ob kein, wenig oder viel Eis 
verkauft wurde. Diskutieren Sie Möglichkeiten, wie Sie Ihr Vorgehen anpassen könnten, um 
die notwendige Eismenge in Litern vorherzusagen. Fassen Sie das Diskussionsergebnis 
knapp zusammen. 


Forschungsauftrag: k-Nächste-Nachbarn für Verkehrsschilder 

Viele Autos verfügen mittlerweile über die Funktion, Verkehrszeichen zu erkennen und der 

Fahrerin bzw. dem Fahrer diese Information mitzuteilen. Dieses Problem ist auch mithilfe des 

k-Nächste-Nachbarn-Verfahrens lösbar. Um die anfallende Datenmenge zu reduzieren, kann 

ein Bild in der Größe reduziert werden (in diesem Fall auf 4x4 Pixel). Da je Pixel 3 Farbwerte 

(RGB) zu erfassen sind, besteht ein Datensatz aus 48 Werten und einem zugehörigen Label 

wie zum Beispiel „STOP“. 

a Analysieren Sie die Methode in der Vorlage, die den Abstand bestimmt, und ergänzen 
Sie die fehlenden Stellen. 

b Variieren Sie den Parameter k und rufen Sie Methoden mit weiteren Eingabebildern auf, 
um Ihr Modell zu testen. 
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> Klassifikation be- 
zeichnet die Eintei- 
lung in eine von zwei 
oder mehr Kategori- 
en, etwa stabil oder 
instabil. Wird keine 
Klasse, sondern eine 
Zahl vorhergesagt, 


136 


spricht man von 
Regression. 


4.3 Alternative2 Entscheidungsbäume generieren: Überwachtes 
Lernen umsetzen 


Roberts Eltern betreiben ein größeres Restaurant. Um die Anzahl der Servicekräfte dem 
Gästeaufkommen anpassen zu können, führen sie einige Wochen lang eine Statistik: 


| Werktag | Zeit | wetter | Ferien | Eventsin der Stadt | Gästeaufkommen 
ja 5 och 


abends | sonnig | ja 


mittags | bewölkt | ja 3 


mittags | Regen nein 10 


mittags | sonnig | nein 


abends | Regen nein 


mittags | sonnig nein 


1.6. mittags | Regen ja 12 
2.6. ja mittags | sonnig | ja 11 
3.6. nein abends | bewölkt | nein 1 


a Diese Daten möchte Robert nutzen, um das Gästeaufkom- 
men vorherzusagen. Dazu notiert er sich eine erste Regel 
wie rechts abgebildet. Begründen Sie, warum diese eine 
Regel nicht ausreicht, um allen vorhandenen Daten die 
Label hoch/normal richtig zuzuordnen. normal hoch 

b Ergänzen Sie eine Regel, um zu entscheiden, ob an einem Werktag ein hohes Gästeauf- 
kommen zu erwarten ist. Begründen Sie Ihre Ergänzung. 

c Kombinieren Sie die Regeln aus a) und b), indem Sie den „JA”-Fall aus a) mit der 
Regel aus b) weiter untergliedern. Sagen Sie damit voraus, mit welchem Gästeauf- 
kommen Roberts Eltern an einem sonnigen Mittwochabend außerhalb der Ferien mit 
12 Events in der Stadt rechnen müssen. 


Entscheidungsbäume ‚Wurzel 
Entscheidungsbäume sind eine einfache Form der (_) Kern? 
Wissensrepräsentation, die gegebenen Daten ein (NEIN), Knöf 
Label zuordnen können (>Klassifikation). Jeder i ee 
innere Knoten und die Wurzel repräsentiert eine stabil (Q Anzahl Kontakte? 
Entscheidungsregel. Wertet man diese Regeln begin- 
nend bei der Wurzel aus, gelangt man schrittweise im 
Baum absteigend zu einem Blatt. Jedes Blatt steht für 
ein konkretes Label (im Beispiel zur Stabilität von Teil- 
chen etwa stabil/instabil). Entscheidungsbäume kön- 
nen von Fachleuten erstellt (wissensbasierte Kl), aber 
auch durch einen Algorithmus automatisiert aus Daten generiert, also gelernt, werden (daten- 
basierte Kl). 


; Blatt 
stabil instabil 


Entscheidungsbaum zur Überprüfung, ob 
fiktive Teilchen stabil oder instabil sind 


4.3 Alternative 2 rwachtesLernenumse 


Entscheidungsbäume 


Wie lernt ein KlI-System einen Entscheidungsbaum aus Daten? 


Als Eingabe erhält das Kl-System mit Labeln Far Zustand 
(Label) 


versehene Daten. Der Entscheidungsbaum 
[®) Kreis nein 0 


zur Klassifikation in stabil bzw. instabil (blau 
bzw. rot dargestellt) wird beginnend bei der 
Wurzel wie folgt aufgebaut: © Kreis ja 1 


> Dreieck | nein 2 


1 Bestes Merkmal für 
Aufteilung (siehe unten) 
wählen und aktuellen 
Knoten damit beschriften. 


> Anfangs gehören 
alle Daten zur 
Wurzel. 


der Merkmalsausprä- 
gungen auf zwei neue 


Knoten aufteilen. Anzahl 


Kontakte? PR 
ze > — Bei einem 


numerischen 


Merkmal teilt 

eine Bedingung 
stabil die Daten in zwei 
‘ instabil Gruppen. 


Manchmal ist aufgrund der gegebenen Datensätze 
keine vollständige Trennung möglich. 


3 Falls keine weiteren Merkmale zur Unterscheidung 
existieren oder alle Datensätze dasselbe Label 
aufweisen, so ist dieser Knoten ein Blatt, ansonsten 
bei 1 fortsetzen. 


Das beste Merkmal für die Aufteilung der Daten ergibt sich aus dem Informationsgewinn: Der FFEREE 

m 
Informationsgewinn ist ein Maß dafür, wie hoch die Aussagekraft eines Merkmals hinsichtlich Herma 
des vorherzusagenden Labels ist. Dazu werden alle verfügbaren Merkmale betrachtet und eine winn links höher 


Entscheidungsregel für das Merkmal mit dem höchsten Informationsgewinn dem Baum hinzu- En ni u . 
gefügt. Die folgende Abbildung zeigt zwei Merkmale mit unterschiedlichem Informationsge- ae 


winn. Aufgabe 3, 


Form? 


(JA) [nen] wen Ss niedriger 
Informations- 


Informations- h 
@ gewinn 3 gewinn 


Der gelernte Entscheidungsbaum lässt sich anschließend nutzen, um neuen Datensätzen ein 
Label zuzuordnen. 


Entscheidungsbäume können aus gelabelten Daten automatisiert generiert, also erlernt, 
werden. Dazu werden die Daten schrittweise anhand der Merkmale mit dem höchsten In- 
formationsgewinn aufgeteilt, bis keine Merkmale zur Unterscheidung mehr vorliegen oder 
alle Datensätze dasselbe Label aufweisen. 
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Aufgaben 


y- & 1 Entscheidungsbäume händisch erstellen (aus Al unplugged) 
Auf der Webseite steht ein Kartenset mit beißenden und nicht beißenden Äffchen zur Verfü- 
& gung. Ziel istes, einen Entscheidungsbaum zu lernen, derfür ein gegebenes Äffchen entweder 

das Label „beißt“ oder das Label,beißt nicht“ ausgibt. 

a Entwickeln Sie Regeln, mit denen sich auch unbekannten Äffchen ein Label beißt” oder 
„beißt nicht“ zuordnen lässt. Notieren Sie diese Regeln in Form eines Entscheidungs- 
baums. 

b Ihre Lehrkraft wird Ihnen nun verschiedene weitere Äffchen zeigen. Notieren Sie jeweils 
die Entscheidung auf Basis Ihres Entscheidungsbaums. 

c Nun wird Ihnen die Lehrkraft eine Auflösung über die richtigen Label für die Elemente aus 
Aufgabe b) geben. Zählen Sie, wie viele Label Ihr Entscheidungsbaum richtig vorherge- 
sagt hat. 

d Vergleichen Sie Entscheidungsbäume innerhalb der Klasse. Diskutieren Sie, welcher Ent- 
scheidungsbaum in der Praxis zum Einsatz kommen sollte und wie das Verfahren insge- 
samt verbessert werden könnte. 


8 = 2 Richtig oder falsch? 
Entscheiden Sie, ob die folgenden Aussagen richtig oder falsch sind. Korrigieren Sie falsche 
Aussagen. 
a An der Wurzel kann man ablesen, welches Label einer Eingabe zugeordnet werden sollte. 
b Ein erlernter Entscheidungsbaum ist stets eindeutig. 
c Ein Knoten wird nicht weiter aufgeteilt, wenn alle Datensätze dasselbe Label haben oder 
die Datensätze hinsichtlich ihrer Merkmale ununterscheidbar sind. 


[6) = 3 Informationsgewinn berechnen 

Um zu bestimmen, welches Merkmal für die Aufteilung eines Knotens am besten geeignet ist, 

muss der sogenannte Informationsgewinn bestimmt werden. Dabei ist das Ziel möglichst sor- 

tenreine Unterknoten zu erzeugen. 

a Im Beispiel aus dem Lehrtext lässt sich die Sorten-Unreinheit des ersten Knotens mit dem 
folgenden Term als eine Zahl berechnen: 


2 2 
j= Anzahlder stabilen Teilchen \ _ | _Anzahlderinstabilen Teilchen 
Anzahl aller Teilchen Anzahl aller Teilchen 


Das Ergebnis 0,5 impliziert eine hohe Unreinheit. Je näher der Wert an 0 ist, desto reiner 
ist der Knoten. Berechnen Sie die „Unreinheit” für alle sechs Knoten in den zwei Bäumen 
oberhalb des Merkkastens. 

b Mit dem Ziel, möglichst reine Knoten zu erhalten, lässt 
sich nun der Informationsgewinn bei Aufteilung anhand 
eines bestimmten Merkmals berechnen, indem der Un- 
terschied zwischen der „Unreinheit” vorher und nachher 
bestimmt wird. Im Beispiel rechts berechnet sich der In- 
formationsgewinn also wie folgt: 


6 4 
0,5-(028:&+0-4)=0,332 


Sorten-Unreinheit = 0,5 


D _® 


Sorten-Unreinheit = 0 
Sorten-Unreinheit = 0,28 


Berechnen Sie den Informationsgewinn für die beiden un- 


>C Gini "ur : j 
terschiedlichen Aufteilungen im Lehrtext. 


(1884 - 1965): 


italienischer Statisti- c Der Term für die Unreinheit in a) lässt sich verallgemeinern 


ker; Impurity: engl. 
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und wird nach ihrem Entdecker >Gini-Impurity genannt. 
Unreinheit Geben Sie einen allgemeinen, von einem konkreten Beispiel unabhängigen Term an. 


4.3 Alternative 2 Entscheidungsbäumegenerieren:ÜberwachtesLernenumsetzen 


4 Ein gelernter Entscheidungsbaum? 

Rechts abgebildet sehen Sie einen Entscheidungsbaum 

zur Überprüfung, ob ein fiktives Teilchen stabil bzw. 

instabil ist. 

a Benennen Sie die einzelnen Bestandteile des Entschei- 
dungsbaums. ron? Form? 

b Begründen Sie (ohne Berechnung), warum der Ent- 
scheidungsbaum rechts nicht aus den gegebenen 
Daten entstanden sein kann. 


Kontakte? 


5 Daten zum Lernen eines Entscheidungsbaums 
Um vorherzusagen, ob sich das Ausspielen von Werbung in der Timeline eines sozialen Netz- 
werks lohnt, soll ein Entscheidungsbaum eingesetzt werden. Ziel ist es, auf Basis von in der 
Vergangenheit ausgespielter Werbung vorherzusagen, ob ein User auf die Werbung klickt. Die 
untenstehende Tabelle zeigt einen Ausschnitt der bereits erhobenen Daten. 


ueio anne nun vertan. asinakn sistehng. 


' AM135346 > 200 | Nein Ja 

| oe Ja | > 200 | Nein | Ja 

| KR9993445 | Ja \ < 200 Ja Ja 

, SS1256213 | Nein < 200 Ja | Nein 

, FJ1865532 | Nein < 200 | Nein | Nein 1 
AW665356 | Ja > 200 | Ja Ja 

| FJ1222200 | Nein | <200 | Ja Nein 

\ HF101456 | Ja | 2200 Nein Ja 

| 10839282 Ja | > 200 | Ja | Nein 

, CV728282 Nein <200 \ Ja Nein 


a Kann mit den gegebenen Daten ein Entscheidungsbaum gelernt werden, der alle gege- 
benen Daten korrekt klassifiziert? Begründen Sie Ihre Antwort. 

b Erstellen Sie einen bestmöglichen Entscheidungsbaum, indem Sie die Knoten wiederholt 
anhand des Informationsgewinns aufteilen. 


6 Computer als Werkzeug: Entscheidungsbäume lernen lassen 

Unter bereitgestellten Materialien finden Sie eine Einführung in ein Programm, das aus Daten 

einen Entscheidungsbaum lernen kann. 

a Folgen Sie den Schritten aus dem Video und erstellen Sie damit einen Entscheidungs- 
baum zu den gegebenen Daten (aus Aufgabe 1). 

b Entfernen Sie die Vorgabe im Modell einen Binärbaum zu erstellen. Beschreiben Sie die 
Unterschiede der beiden Bäume und die Auswirkung auf das Labeln der Testdaten. 

c Zur Verfügung steht eine zweite Variante der Daten aus a). Analysieren Sie diese und 
beschreiben Sie den Unterschied. Erstellen Sie mit dem Programm wiederum einen 
Entscheidungsbaum und vergleichen Sie das Ergebnis mit a). 
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4 Künstliche Intelligenz 


4.4 Von der Idee zum Kl-System: Training und Optimierung 


In den E-Mail-Konten einer Firma landen regelmäßig viele Spam-Mails, weshalb ein Filter 
entwickelt werden soll, der eingehende E-Mails automatisch in die Kategorien „Spam“ und 
„kein Spam” einordnet. 

a Nennen Sie jeweils Merkmale, an denen sich erwünschte und unerwünschte E-Mails 

© möglichst gut erkennen lassen. 

b Nachdem ein Spamklassifizierer nach dem Prinzip des überwachten Lernens entwi- 
ckelt und mit einer Reihe händisch klassifizierter E-Mails trainiert worden ist, kommt 
dieser in der Firma zum Einsatz. Leider stellt sich schnell heraus, dass viele Spam-Mails 
nicht als solche erkannt werden, obwohl die zum Training verwendeten E-Mails vom 
System zu 100 % richtig eingeordnet wurden; dafür werden nun aber alle E-Mails, die 
nach 16 Uhr eingehen, komplett als Spam klassifiziert. Beschreiben Sie mögliche Ursa- 
chen für diese Fehlklassifizierungen. 

c Erläutern Sie eine mögliche Vorgehensweise, um die Praxistauglichkeit eines 
Kl-Systems bereits vor dem Produktiveinsatz beurteilen zu können. 


Maschinelles Lernen: Von der Idee zum funktionierenden Modell 

Mithilfe eines gut funktionierenden Systems zum überwachten maschinellen Lernen können 
lästige Aufgaben wie das Aussortieren von Spam-Mails leicht automatisiert werden. Manchmal 
stellt sich aber auch erst im Praxiseinsatz heraus, dass ein System für die angedachte Klassifizie- 
rungsaufgabe ungeeignet scheint und eine hohe Fehlerrate produziert. Um dies zu vermeiden 
und die Klassifikationsgenauigkeit eines Systems zum überwachten maschinellen Lernen bereits 
bei der Entwicklung optimieren und beurteilen zu können, hat sich daher folgendes Vorgehen 
etabliert: 


Schritt 1: Daten erfassen, strukturieren und aufteilen 

Überwachtes maschinelles Lernen kann nur funktionieren, wenn eine 

ausreichende Menge repräsentativer Daten zur Verfügung steht, die das 

System beim „Lernen“ verarbeiten kann. Diese müssen daher zunächst 

in strukturierter Form gesammelt und unvollständige oder offensichtlich 

fehlerhafte Datensätze müssen aussortiert werden. Dabei entsteht eine 

>oftauchengl. Tabelle, bei der jede Spalte einem sogenannten >Merkmal entspricht. 

feature Jenach verwendetem Lernalgorithmus müssen die Daten dabei auch in 
geeigneter Weise codiert werden, z. B. als Zahlenwerte. 


Schließlich werden die vorhandenen Datensätze zufällig auf drei Grup- 
pen verteilt: 


« Der größte Anteil der vorhandenen Datensätze wird zum Training 
des Klassifizierungssystems verwendet („ENTE TEEN). 

« Um die Auswirkungen verschiedener Hyperparameter bewerten zu 
können (siehe nächste Seite), wird ein Teil der vorhandenen Daten 
als »AIRTEIMERRETEN) reserviert und somit nicht zum Training 
verwendet. 

« Ein weiterer Teil der Daten wird als reserviert. Anhand die- 
ser Datensätze kann am Ende überprüft werden, in wie vielen Fällen 
die Klassifikation des Systems tatsächlich korrekt war. 


4.4 Von der Idee zum KI-System: Training und Optimierung 


Schritt 2: Entwicklung, Training und Validierung des Kl-Systems 

Neben der Aufbereitung der Daten muss auch das System zum überwachten Lernen entworfen 
und an das geplante Einsatzszenario angepasst werden. Je nach gewähltem Verfahren gibt es 
hier verschiedene Hyperparameter. Im Gegensatz zu anderen Parametern werden Hyperpara- 
meterwerte nicht während des Trainings erlernt, sondern müssen vor dem eigentlichen Lernpro- 
zess festgelegt werden. Da aber nicht immer im Vorhinein erkennbar ist, welche Hyperparame- 
terwerte zum besten Ergebnis führen, kann es sinnvoll sein, verschiedene Werte auszuprobieren. 
Das System wird dann mit den Trainingsdaten trainiert und anschließend wird überprüft, wie gut 
das so trainierte System die Validierungsdatensätze korrekt zu klassifizieren vermag. Am Ende 
können dann die Hyperparameterwerte gewählt werden, die bei den Validierungsdaten das bes- 
te Klassifizierungsergebnis erzeugt haben. Als letztes wird anhand der Testdaten überprüft, mit 
welcher Zuverlässigkeit mit dem finalen System unbekannte Daten korrekt klassifiziert werden 
können. Bei einem zufriedenstellenden Ergebnis kann das System anschließend produktiv ver- 
wendet werden. 


k-Nächste-Nachbarn 
Anzahl der nächsten Nachbarn Entscheidungsbaum 


bzw. maximale Baumhöhe 


Hyperparameter- 
werte festlegen 
System validieren System trainieren 

Hyperparameterwerte mit der 
Güte messen und für 
System testen 


besten Güte werden für den 
einen Vergleich notieren. 
Overfitting und Underfitting vermeiden 


finalen Test ausgewählt. 
Beim überwachten Lernen wird in der Trainingsphase versucht, allgemeine Entscheidungsregeln 
zu finden, mittels derer zukünftig auch unbekannte Datensätze korrekt klassifiziert werden kön- 
nen. Dabei können zwei Probleme auftreten: 


Werden für das Training eines Systems nicht ausreichend viele repräsentative Datensätze, nur 
wenig relevante Merkmale oder ungünstige Hyperparameterwerte verwendet, so kann das Sys- 
tem unter Umständen nicht ausreichend genau trainiert werden. Dies wird auch als >Underfit- 
ting bezeichnet. Folgende Beispiele zeigen das Versagen der Kl-Systeme bei der Klassifizierung 
des Geschlechts bzw. der Wintermonate durch Underfitting. 


Wichtige Hyper- 
parameter sind 

der Wert von k bei 
k-Nächste-Nachbarn 


und die maximale 
Baumhöhe bei Ent- 
scheidungsbäumen. 


Re 


>engl. 
Unteranpassung 
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Trainingsdaten und nicht aussagekräftigen mit ’M’? 
Mär] Merkmalen (rechts). 


’Apr Mai Jun 
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Okt Nov Dez 


max. Baumhöhe =2 


Umgekehrt kann es problematisch sein, wenn das Modell anhand der Trainingsdaten sehr prä- 
zise lernt, wie genau diese Trainingsdaten richtig zu klassifizieren sind. Eine typische Folgeer- 
scheinung ist, dass neue Daten beim produktiven Einsatz des Kl-Systems nicht richtig klassifiziert 
werden. Eine solche Überanpassung an die Trainingsdaten wird Overfitting genannt. 


Beim k-Nächste-Nachbarn- Overfitting beim Entscheidungsbaumalgorithmus, wenn 
Algorithmus kann Overfitting bei die Komplexität des Baumes nicht sinnvoll begrenzt wird, 
zu klein gewähltem k auftreten: 


& Klassifikation: Wird ein/e Schüler/in das Abitur bestehen? 
© . 0. “=nein m=ja 
op) } 
S = .u = 20 oe 
Fo L Eoygı Don 
a = u o ® o . 
[| = U „ .= 
.. nu Durchschnitt Vornoten < 3,5 ? Durchschnitt Vornoten < 3,5 ? 
“ (gie a Ja Nein 
. k=1° . nu .. nu .. 
> u. .. u. .. 
® u. nu 
Augenfarbe blau? 
Geschlecht: == männlich . 
Eye Ja Nein 
«= weiblich 
i Körpergröße S. an 


In beiden Fällen kann es zusätzlich auch dann zu einer ungewollten Überanpassung kommen, 
wenn die zum Training verwendeten Merkmale nicht allgemein aussagekräftig für das Klassifi- 
kationsproblem sind. Haben beispielsweise zufällig alle in den Trainingsdaten enthaltenen Abi- 
turientinnen und Abiturienten braune Augen, könnte man versucht sein, die Augenfarbe als 
Merkmal für den Abiturerfolg aufzunehmen. In der Wirklichkeit würde ein so trainiertes Modell 
aber kaum bestehen können, da die Augenfarbe keinen direkten Einfluss auf das Abiturergebnis 
hat. 


4.4 Von der Idee zum Kl-System: Training und Optimierung 


Testen des Kl-Systems Klassifikation 
Nach dem Abschluss aller Optimierungen werden die zurückbe- Spam _| Kein Spam 
haltenen Testdaten mithilfe des Modells klassifiziert. Im Idealfall 
ist das Modell nach dem Training in der Lage, auch diese Daten 
mehrheitlich korrekt zu klassifizieren. Da die korrekteKlassifizie- 
rung für sämtliche Testdaten bereits bekannt ist, kann die Güte 
des Kl-Systems anschließend z. B. anhand der rechts gezeigten 
Matrixdarstellung beurteilt und basierend darauf entschieden 
werden, ob die erreichten Fehlerraten für den geplanten Ein- 
satzzweck ausreichend niedrig sind. 


185 
(Fehler 1. Art) 


Tatsächlich 
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Gesamt: 2370 Datensätze 


Damit Over- und Underfitting erkannt werden können, ist es wichtig, dass die Validierungs- und 
Testdaten selbst nicht zum Training des Modells verwendet werden. Nur so kann ausgeschlossen 
werden, dass das Modell spezifisch an die Testdaten angepasst wurde und sich die beim Test 
ermittelte Modellgüte nicht auf beliebige andere Daten verallgemeinern lässt. 


Gut aufbereitete Ausgangsdaten sind eine zentrale Voraussetzung für überwachtes maschi- 
nelles Lernen. Die erfassten Daten müssen dafür strukturiert, von unvollständigen oder 
fehlerhaften Datensätzen bereinigt und alle Merkmale in ein geeignetes Format gebracht 
werden. Neben den Trainingsdaten hängt die erzielbare Klassifikationsgenauigkeit eines 
Systems ebenfalls maßgeblich von seinen Hyperparameterwerten ab. Um die Güte eines 
Systems verlässlich bestimmen zu können, dürfen die Validierungs- und Testdaten nicht 
bereits zum Training des Systems verwendet worden sein. 


Aufgaben 


1 Trainingsdaten sinnvoll codieren: k-Nächste-Nachbarn 

Mittels des k-Nächste-Nachbarn-Algorithmus soll vorhergesagt werden, ob eine Kinovorstel- 

lung ausverkauft sein wird. Dabei werden die Merkmale Tageszeit“ und,Wochentag“ verwen- 

det. 

a Um die k nächsten Nachbarn zu einem Datenpunkt ermitteln zu können, ist es zwingend 
erforderlich, dass der Abstand zwischen zwei Datenpunkten sinnvoll berechnet werden 
kann (siehe auch 5. 133 Aufgabe 1). Im konkreten Fall können Sie die Tageszeit als ganze 
Stunden (Werte 0-23) und die Wochentage ebenfalls als Zahlen (Montag=1, Dienstag=2, 
usw.) codieren. Tragen Sie folgende Beispieldatenpunkte in ein Koordinatensystem ein 
und erläutern Sie, weshalb die normale (euklidische) Abstandsberechnung bei diesem 
Codierungssystem nicht immer sinnvolle Ergebnisse liefert. 


— Fochentag | Ausveraun 


20 | 6 ja 
22 7 ja 

— 
7 | 1 | nein 


b Beschreiben Sie ein für diesen Anwendungsfall besser geeignetes Verfahren zur Ab- 
standsberechnung. 

c Erklären Sie, weshalb es bei der Klassifikation anhand von Tageszeit und Wochentag leicht 
zu Underfitting kommen kann, und beschreiben Sie, wie das System verbessert werden 
könnte. 


Kann eine 
Kl basierend 
auf vielen 
Realdaten 
keine 100%- 
sicheren 
Vorhersagen 
treffen? 


BEBe 


Nein und es 
gibt sogar 

unterschiedliche 
Fehlerarten! 
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A Oo, = 2 Qualitätsmerkmale beim überwachten Lernen 
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> precision: dt. 
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Um die Güte eines Modells zum überwachten Lernen zu bewerten, können beim Testen ver- 
schiedene Bewertungsgrößen eingesetzt werden. Häufig verwendet wird dabei die >accura- 
cy a, welche den Anteil der korrekten Klassifizierungen an allen durchgeführten Klassifizierun- 
gen beschreibt. 

Für ein konkretes Label lassen sich zudem recall und precision bestimmen. Der >recall r ist ein 
Maß für den Anteil der korrekt (für Label A) klassifizierten Datensätze an allen tatsächlichen 
Label-A-Datensätzen. Bei einem Spamklassifikator, bei dem E-Mails das Label „Spam“ zugeord- 
net werden soll, gibt der Recall die Trefferquote der Spam-Mails an. Ein recall von 0,8 bedeutet 
also, dass 80 % der Spam-Mails erkannt werden, jedoch 20 % unentdeckt bleiben. 

Dagegen misst die >precision p, wie präzise der Spam-Filter unerwünschte Nachrichten er- 
kennt. Eine precision von 60 % bedeutet, dass nur 60 % der E-Mails im Spam-Ordner Spam sind. 


Anzahl der korrekt klassifizierten Datensätze mit Label A klassifizierte Datensätze 
N 


= Anzahl aller klassifizierten Datensätze 

Anzahl der mit Label A korrekt klassifizierten Datensätze 
P= Anzahl aller mit Label A klassifizierten Datensätze 
r= Anzahl der mit Label A korrekt klassifizierten Datensätze 


Anzahl der tatsächlichen Label-A-Datensätze 


=tatsächliche Label-A-Datensätze 
== tatsächliche Datensätze ohne Label A 

a Gehen Sie davon aus, dass unter 1000 E-Mails fünf Spam-Mails sind. Erläutern Sie am Bei- 
spiel eines Spamklassifikators, der einfach alle Mails als „kein Spam“ klassifiziert, weshalb 
die Güte eines Klassifikators nicht allein anhand der accuracy bewertet werden sollte. 

b Erklären Sie am Beispiel eines HIV-Tests die Bedeutung von precision und recall. Diskutie- 
ren Sie anschließend in Kleingruppen, welche dieser Metriken bei einem HIV-Test vorran- 
gig optimiert werden sollte, und gehen Sie dabei auch auf die möglichen Folgen von 
niedrigen Werten für precision bzw. recall ein. 


Datenerfassung in der Praxis 

Erläutern Sie für die folgenden Fragestellungen, welche Merkmale in Ihren Augen für eine 
erfolgreiche Klassifikation besonders relevant sind und wie Sie diese Daten in der Praxis erhe- 
ben könnten. 

a Soll ein Fluggast einer besonders detaillierten Sicherheitskontrolle unterzogen werden? 

b Wird ein Zug seinen Endbahnhof mit mehr als 60 min Verspätung erreichen? 

c Wird ein Internetvideo mehr als eine Million Aufrufe erreichen? 


Modellgüte beurteilen 

Betrachten Sie für die folgenden Teilaufgaben die abgebildete Matrix zur Klassifikations- 

genauigkeit eines Spamfilters auf S. 143. 

a Ordnen Sie den vier Feldern hinsichtlich des Merkmals „Spam“ die Fachbegriffe true posi- 
tive, false positive, true negative, false negative zu. 

b Diskutieren Sie allgemein für das Anwendungsszenario eines Spamfilters, ob Fehler 1. Art 
oder 2. Art die Praxistauglichkeit des Systems gravierender beeinflussen. 

c Erläutern Sie unter Bezugnahme auf die in der Matrix abgedruckten Beispielwerte, inwie- 
weit Sie einen derartigen Spamfilter für praxistauglich halten. 

d Legen Sie dar, inwieweit Ihre Antwort für Teilaufgabe b) anders ausfallen würde, wenn es 
nicht um ein Spamfilter sondern um i ein System zur Hautkrebserkennung oder ii ein Ge- 
sichtserkennungssystem zur Fahndung nach Terroristinnen und Terroristen mittels Video- 
überwachung ginge. 


4.4 Von der Idee zum KI-System: Training und Optimierung 


5 Trainingsdaten vs. Validierungsdaten vs. Testdaten 


Bei der Optimierung und Bewertung eines Kl-Systems spielen insbesondere die Validierungs- 

und Testdaten eine besondere Rolle. 

a Beschreiben Sie in Ihren eigenen Worten, welche Probleme auftreten können, wenn an- 
stelle der Testdaten die Validierungs- oder Trainingsdaten für die Beurteilung der Eignung 
eines KI-Systems herangezogen würden. 

b Recherchieren Sie, was sich hinter dem Begriff Kreuzvalidierung verbirgt, und erläutern 
Sie den Hauptvorteil dieses Verfahrens gegenüber einer statischen Aufteilung der zur Ver- 
fügung stehenden Daten in Trainings-, Validierungs- und Testdaten. 


Ein eigenes KI-System trainieren und testen 

In den zu dieser Aufgabe bereitgestellten Materialien finden Sie eine >CSV-Datei mit verschie- 

denen Angaben zu Gemeinden in Bayern. Mithilfe dieser Daten soll ein KI-System trainiert 

werden, das entscheidet, ob sich in einer Gemeinde mindestens ein Gymnasium befindet. 

a Für die Bearbeitung dieser Aufgabe kann wahlweise das k-Nächste-Nachbarn- oder das 
Entscheidungsbaumverfahren verwendet werden, wobei in den Materialien jeweils eine 
verfahrensspezifische Anleitung enthalten ist. Befolgen Sie die dort genannten Schritte 
zur Einrichtung des Kl-Systems für ein Verfahren Ihrer Wahl. 

b Versuchen Sie durch eine geeignete Merkmalsauswahl und sinnvolle Hyperparameter- 
werte (siehe Anleitung) ein möglichst optimales Klassifikationsergebnis für die Validie- 
rungsdaten zu erzielen. 

c Testen Sie die Güte Ihres Kl-Systems anhand der Testdaten und vergleichen Sie Ihre Ergeb- 
nisse mit denen anderer Klassenmitglieder. 

d Für Schnelle: Recherchieren Sie entsprechende Daten für Gemeinden in anderen Bundes- 
ländern und überprüfen Sie, ob Ihr KI-System auch diese korrekt zu klassifizieren vermag. 


Forschungsauftrag: CAPTCHAs 

Eine zentrale Herausforderung bei der Entwicklung eines Systems zum maschinellen Lernen 

ist die Verfügbarkeit einer ausreichend großen Menge an Trainingsdaten. Im Bereich der Bild- 

und Texterkennung hilft heute ein Großteil der Internetnutzer beim Erzeugen passender Trai- 

ningsdaten - vermutlich oftmals, ohne dies zu wissen. 

a Recherchieren Sie, was sich hinter dem Begriff CAPTCHA und dem heutzutage weit ver- 
breiteten reCAPTCHA-System verbirgt, und beschreiben Sie Aufbau und Funktionsweise. 

b Erläutern Sie, wie mittels des reCAPTCHA-Systems Trainingsdaten für die Bild- und Texter- 
kennung gesammelt werden. 

c Diskutieren Sie folgende Aussage: Kl-gestützte Bild- und Texterkennung ist sowohl Profi- 
teur des reCAPTCHA-Systems als auch dessen größte Bedrohung. 
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4.5 Das künstliche Neuron: Baustein des neuronalen Netzes 


iB>8 
In einer Anlage zum Sortieren von Äpfeln ist es das Ziel, zwei unterschiedliche Qualitätsstu- 
fen aufgrund zweier möglichst einfacher Merkmale (z.B. Größe, Farbwert) zu unterscheiden, 
damit die Äpfel automatisch klassifiziert werden können. 

a Erproben Sie das Spiel mehrfach und versuchen Sie, die passende Trenngerade zwi- 


schen den Qualitätsstufen möglichst schnell zu finden. 
b Beschreiben Sie Ihre Strategie zur Bestimmung der Trenngeraden. 


Das künstliche 
Neuron in der 
Informatik 
versucht, dieses 
Verhalten zu 
imitieren. 


Spannung > 
75 Millivolt? 


In der Biologie ist ein Neuron 
eine Nervenzelle, die elektrische 
Reizsignale ab einem gewissen 
Wert - dem sogenannten 
Schwellenwert - weiterleitet. 
Man sagt: Das Neuron feuert. 


Ein künstliches Neuron trennt längs einer Geraden 

Ein künstliches >Neuron ist ein Modell nach dem Vorbild einer natürlichen Nervenzelle, das als 
Eingaben mehrere Zahlenwerte 
verarbeiten kann undentweder 0 
oder 1 ausgibt. 

Im Beispiel links verfügt das Neu- 
ron über zwei Eingängex, undx,. 
Jeder Eingang hat ein bestimm- 
tes Gewicht (w, und w,, vom 
engl. weight); je größer das Gewicht, desto stärker wirkt sich der Eingabewert auf das Ergebnis 
aus, also desto gewichtiger ist der zugehörige Eingabewert. So kann der Durchmesser eines 
Apfels mehr Einfluss auf die Qualität haben als der Anteil einer bestimmten Farbe. Der Wert s 
dient als Schwellenwert; wenn dieser Wert vom Term w,-x,+ W,.%, überschritten wird, „feuert“ das 
Neuron. Dies wird realisiert durch die Aktivierungsfunktion, die bei Werten größer als Null den 
Wert 1 liefert, bei allen kleineren Werten ergibt sich (wie bei Inaktivität des Neurons) der Wert 0. 
Folgendes Beispiel zeigt ein künstliches Neuron mit den Werten w, =-1,w,=2,5=4: 


gewichtete Summe 
- Schwellenwert 


Aktivierungs- 
funktion 


Eingaben 


künstliches Neuron 


9>4 
gewichtete Summe > Schwellenwert 


Kein Feuer. 


-1<4 
gewichtete Summe = Schwellenwert 


4.5 Das künstliche Neuron: Baustein des neuronalen Netzes 


del 


Die Grenze zwischen, feuert” und, feuert nicht“ liegt genau 
dort, wo „gewichtete Summe = Schwellenwert‘, also im 
Beispiel -x; + 2x, =4 gilt. 


Mit Aufgabe 
1a) können Sie 
das praktisch 
erproben! 


Umformen ergibt X2 = IX +2, 


dies entspricht der Gleichung einer linearen Funktion mit 
Steigung + und y-Achsenabschnitt 2, d. h. die Ebene wird 
durch die zugehörige Gerade in zwei Bereiche (sog. Halb- 
ebenen) aufgeteilt, die jeweils ein Label repräsentieren. 
Deshalb bezeichnet man das künstliche Neuron auch als 
linearen >Separator. 

Allgemein kann ein künstliches Neuron beliebig viele Ein- 
gaben verarbeiten. Bei drei Eingaben wird der dreidimen- 
sionale Raum beispielsweise nach dem gleichen Prinzip 
durch eine Ebene getrennt. 


>separare: lat. 
trennen 


Für jeden Punkt des roten Bereichs 
liefert das Neuron den Wert 1, im 

x blauen Bereich den Wert 0. 

Die Abbildung links zeigt eine 

% vereinfachte Darstellungeines allgemeinen künstlichen Neuronsmit 
den Eingabewerten x,, ...,x,. Die Gewichte w,, ..., w, werden hieran 
den Eingangspfeilen notiert. 


Das künstliche Neuron kann selbst lernen 

Die Nutzung des künstlichen Neurons ist sehr einfach, weil man nur die Werte einsetzen muss. 
Allerdings ist es aufwendig, passende Gewichte von Hand zu bestimmen. Es gibt aber ein Ver- 
fahren, mit dem man das Neuron trainieren kann; ein solches lernfähiges Neuron wird auch 
>Perzeptron genannt. 

Die Grundidee beim überwachten Lernen des Perzeptrons besteht darin, die anfangs beliebig 
gewählten Gewichte und den Schwellenwert mit jedem eingelesenen Element aus dem Trai- 
ningsdatensatz mit dem Label zu vergleichen und bei Bedarf mit Hilfe der sogenannten Delta- 
Lernregel zu verbessern: 


> lat. perceptio, 
engl. perception, 
wahrnehmen, 
erkennen 


Waeu = Want + a * (Labelwert-berechnetes Ergebnis) * Eingabe 


Berechnet: 0 
Niedrige Qualität 
\/ 


Ist das berechnete Ergebnis zu klein 
(also 0 statt 1), so muss ich die 
Gewichte nach oben korrigieren, ist 
es zu groß (also 1 statt 0), dann 
nach unten. Die Differenz „Labelwert 
- berechnetes Ergebnis“ zeigt das 
Vorzeichen der Korrektur an. 


Label 1 
Gute Qualität 


Die Gewichtsanpassung darf aber 
nicht zu schnell passieren, sonst 
können sich die Gewichte nicht auf 
den richtigen Wert einpendeln. Daher 
wird die Differenz mit einem Faktor 
zwischen O und 7 multipliziert, der 
üblicherweise nahe bei 0 (z. B. 0,1) 
liegt. Dieser Faktor heißt Lernrate «. 


Je größer 
der Wert 
der Eingabe, 
umso stärker 
muss ich 

das Gewicht 
anpassen. 
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Die Aufgaben 1b) Die Formel gilt analog - aber mit negativem Rechenzeichen - auch für den Schwellenwert: 
und 2 zeigen das Snu=Sn-a' (Labelwert-berechnetes Ergebnis) - 7 

Training eines 

Perzeptrons in der Beispiel: 


Praxis! 


E Für ein gegebenes Perzeptron ist bekannt, dass es für die Werte 

N) x, = 3,% =2 den Wert 0 liefern soll. Dieser Wert wird bei den gege- 
benen Gewichten auch berechnet. Die Formeln liefern dieselben 
Gewichte wie zuvor; die Gewichte werden also nicht angepasst. 


a. 4 Wineu = -1 +0,1-(0-0)-3=-1+0 = -1 
3.(-1)+2-2-4=-3 Wareu = 2 +0,1-(0-0)-2=2+0 =2 
Aktivierungsfunktion(-3) =0 Su = 4-01: (0-0)-1=24+0 =4 


Außerdem ist bekannt, dass sich für x, =4,x, = 3 der Wert 1 ergeben 
soll. Das Perzeptron ermittelt aber den Wert 0. Deshalb werden die 
Gewichte und der Schwellenwert in die passende Richtung korri- 
giert; die Stärke der Anpassung hängt vom Eingangswert ab. 

Wine = -1 +0,1-(1-0)-4 = -0,6 


4 
4-(-1)+3-2-4=-2 Waneu = 2 +0,1:(1-0):-3 = 23,3 
Aktivierungsfunktion(-2) =0 Su = 4-01 .(1-0)-1 = 39 
Achtung, nicht 06 Für den nächsten Trainingsdatensatz werden die angepassten 
all Problame Gewichte verwendet. 
kann man linear Durch viele weitere Berechnungsschritte nähern sich Gewichte und 
separieren! Schwellenwert den korrekten Werten an. 


Ein künstliches Neuron ist eine Funktion, die abhängig von gewichteten Eingaben und 
einem Schwellenwert den Wert 1 (Aktivierung) oder 0 (keine Aktivierung) ausgibt und da- 
durch zwei geeignete Label linear separiert. Das Perzeptron als Erweiterung des künstli- 
chen Neurons beherrscht einen einfachen Klassifikationsalgorithmus, bei dem das Neuron 
durch eine schrittweise Anpassung der Gewichte und des Schwellenwertes nach der Delta- 
Lernregel lernen kann, das richtige Label zu vergeben. 


je) 


Aufgaben 


& EG OR 1 Das künstliche Neuron erkunden 
a Erproben Sie in Partnerarbeit mit der Vorlage, wie das Neuron rechnet. Rechnen Sie erste 
Werte mit dem Taschenrechner nach. Untersuchen Sie durch das Setzen weiterer Punkte 

die ungefähre Lage der Trenngerade und formulieren Sie einen Zusammenhang zwischen 
dem Wert vor Anwendung der Aktivierungsfunktion und dem Abstand zur Trenngeraden. 

b Öffnen Sie die Vorlage zu Teilaufgabe b. Erkunden Sie, in welchen Bereichen das Perzept- 
ron seine Werte verändert und in welchen Bereichen nicht. Beobachten Sie, wie sich die 
Werte verändern. Vollziehen Sie ein bis zwei Berechnungen mit Papier und Taschenrech- 
ner nach. 
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4.5 Das künstliche Neuron: Baustein des neuronalen Netzes die 


2 Das Perzeptron erkunden mit der Tabellenkalkulation ERA 
Im beigefügten Tabellendokument wird ein Neuron in 1000 Lernschritten trainiert. 
a Legen Sie in Zeile 2 mehrfach beliebige Startwerte für Gewichte und Schwellenwert fest. & 


Halten Sie die Lernrate dabei konstant. 

b Vollziehen Sie zwei aufeinanderfolgende Berechnungsschritte mit Papier und Taschen- 
rechner nach, von denen der erste Berechnungsschritt eine Differenz „gewünscht - er- 
rechnet“ ungleich 0 aufweist. 

c Erkunden Sie, was im Zellbereich K10:N18 berechnet und im Diagramm darunter darge- 
stellt wird. Beurteilen Sie die Qualität der Annäherung an das gewünschte Ergebnis nach 
100 bzw. 1000 Berechnungsschritten. Erproben Sie mehrfach bei gleichbleibenden Start- 
werten. (Hinweis: Neuberechnung im Tabellenkalkulationsprogramm mit der Taste F9) 

d Variieren Sie die Lernrate mit Werten zwischen 0 und 1 bei ansonsten gleichen Eingangs- 
werten und erproben Sie, bei welchen Werten das Neuron am besten lernt. 


3 Richtig oder falsch 

Entscheiden Sie, ob die folgenden Aussagen wahr oder falsch sind. Korrigieren Sie falsche 

Aussagen! 

a Ein künstliches Neuron hat immer zwei Eingänge und einen Ausgang. 

b Das künstliche Neuron löst beliebige Separationsprobleme. 

c Unterschreitet die gewichtete Summe den Schwellenwert, so feuert das Neuron. 

d Das Perzeptron passt die Gewichte genau dann an, wenn das Label und der berechnete 
Wert nicht übereinstimmen. 

e Für eine Bewerbung können die Label „einladen“, „ablehnen“ und „Warteliste“ durch ein 
künstliches Neuron nicht unterschieden werden. 


U 
>] 


4 Neuronen für die logischen Funktionen a9 N: 
a Die UND-Funktion liefert genau dann den Wert Wenn ich Zeit habe 
WAHR (Wert: 1), wenn alle Eingänge den Wert und das Wetter passt, 
WAHR haben. Begründen Sie, weshalb man das gehe ich Eislaufen. 


dargestellte künstliche Neuron als UND-Neuron & 
bezeichnen kann. Wahrheitswerte 


1 N 
UND 


1 Wahrheitswert 
1,5 


b Franka behauptet, dass für den Schwellenwert auch jede andere Zahl aus dem Intervall 
]0, 2[ in Frage kommt. Korrigieren Sie Frankas Aussage passend und begründen Sie Ihre 
Ansicht. 

c Skizzieren Sie ein UND-Neuron für drei Eingabewerte. 

d Entwickeln Sie ein 
ODER- und ein NICHT- 


Wenn ich nicht 
lernen muss, 


Wenn Ulli oder Alex 
mitkommen, gehe 


Neuron. Testen Sie ich a komme ich mit, 
jeweils für alle 
möglichen Eingaben PARISESWENE Wahrheitswert 
mit einer geeigneten 
Wahrheitswert Wahrheitswert 
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= a 5 Probleme lösen mit künstlichen Neuronen 

a Für ein Auto berechnet man den Mindestabstand zum Vorausfahrenden bei höheren Ge- 
schwindigkeiten nach der Faustformel „Mindestabstand in m = halbe Tachometeranzeige 
in km/h“, also bei 100 km/h mindestens 50 m Abstand. Entwickeln Sie ein Neuron, das ab- 
hängig von Geschwindigkeit und Abstand feuert, wenn ein Auto den notwendigen Ab- 
stand nicht einhält. 

b Ein Influencer auf einer Videoplattform möchte mindestens eine Million Views im Monat 
generieren, um von den Werbeeinnahmen in Saus und Braus leben zu können. Mit jedem 
Fitnessvideo erhält er durchschnittlich 70000 Views, mit einem Ernährungsvideo 60000 
Views. Stellen Sie eine Ungleichung auf, die feststellt, ob er bei einer bestimmten Anzahl 
an Fitness- und Ernährungsvideos insgesamt genügend Views erhält. Skizzieren Sie damit 
ein passendes Neuron. 


4 Künstliche Intelligenz 


6 Der Lernvorgang, „von Hand durchgerechnet” 
Ein Perzeptron hat zu Beginn die Gewichte, wie sie in der Skizze angegeben sind. Bestimmen 
Sie von Hand die Gewichte nach den ersten drei Lernschritten mit einer Lernrate von 0,1 und 
den folgenden Werten der Trainingsdaten. 
Trainingsdaten: 


1 oo 1 'o 
TE -3 'o | 
3 | ___]jo 1 | 


DO 7 Das Perzeptron implementieren - vorwärts und rückwärts 

a Implementieren Sie im Team das Berechnungsverfahren des künstlichen Neurons mit 
zwei Eingängen zur Berechnung des Ergebnisses in der im Unterricht eingesetzten 
Sprache. Als Hilfestellung können Sie bei Bedarf das Rechenblatt von Aufgabe 2 nutzen. 

b Ergänzen Sie das Neuron um das Lernverfahren. Testen Sie ausführlich! Zur Überprüfung 
der Korrektheit können Sie mit dem Rechenblatt parallel testen. 

c Für Schnelle: Verbessern Sie Ihr Programm weiter, z.B. um grafische Benutzerführung und 
grafische Ausgabe. 


8 ° 8 Machbar für das Neuron? 
Entscheiden und begründen Sie, ob in den folgenden Bildern die beiden Label absolut oder 
zumindest näherungsweise linear separiert werden können: 


i PR I iv LI v DR A 
... . 2 rfanter Velen seret 
Es De 0,90 ..... 

o.. 


9 


10 


4.5 Das künstliche Neuron: Baustein des neuronalen Netzes 


Ähnlich oder gleich? BO 
Die Gewichte der Neuronen in den Darstellungen i) und ii) unterscheiden sich um das Vor- 
zeichen, bei den Darstellungen i) und iii) um den Faktor 2. Ermitteln Sie jeweils die Trennge- 
raden und begründen Sie, weshalb diese identisch sind. Überprüfen Sie außerdem, ob die 
Neuronen die gleiche Halbebene beschreiben. 
i Fi ü 2 ii ._4 

1 1 -2 

3 -3 6 

Forschungsauftrag: Natürliches Neuron genauer betrachtet KR Oo 


Nachfolgend finden Sie einen Auszug aus 
einem Biologiebuch. Entwickeln Sie eine 
Gegenüberstellung von Gemeinsamkeiten 
und Unterschieden von natürlichen und 
künstlichen Neuronen. 
Neurone sind oft extrem lang gestreckte Zel- 
len. Einige werden über einen Meter lang, wo- 
bei der Durchmesser des Zellkörpers meist 
geringer als 0,1 mm ist. Bei den meisten Ner- 
venzellen lassen sich vier Abschnitte gut von- 
einander abgrenzen: 

1. Die Dendriten (griech. dendron: Baum) 
sind weitverzweigte Zellfortsätze, die sich 
wie Antennen im Raum ausbreiten. 

2. Der Zellkörper (Soma) ist das biosyntheti- 
sche Zentrum der Zelle. Er enthält den 
Zellkern und neben Mitochondrien auch 
alle Zellorganellen, die für die Proteinbio- 
synthese notwendig sind. 

3. Das Axon, auch Nervenfaser genannt, istein 
Zellfortsatz, der viel länger als die Dendriten 
ist. Über das Axon werden die von der Zelle 
erzeugten Signale weitergeleitet. Elektro- 
nenmikroskopische Bilder zeigen, dass auch 
hier Mitochondrien liegen. Dies lässt darauf 
schließen, dass die Weiterleitung der elektri- 
schen Signale im Axon ein energieintensiver 
Prozess ist. Die Myelinscheide umgibt das 
Axon und isoliert es elektrisch. 

4. Nahe seinem Ende verzweigt sich das 
Axon. Die Zweige enden in verdickten 
„Endknöpfchen‘; den präsynaptischen En- 
digungen der Nervenzelle. Sie bilden mit 
den Dendriten anderer Neuronen oder mit 
Muskelzellen Synapsen zur Übertragung 
der Signale. 


präsynaptische 
Endigung 


präsynaptische Endigungen, 
REM 


Dendriten 


Zellkörper 


Axonhügel 


Myelinscheide 


AT . 
räsynaptische Endigun: 


ranvierscher 
Schnürring Pr En M N) 

NER. . 
Synapse an einem Dendriten, TEM 


präsynaptische 
Endigung 
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4.6 Gemeinsam sind Neuronen stark: Das neuronale Netz 


Für die Sortieranlage einer Apfelplantage mit vielen unterschiedlichen Apfelsorten reicht 

ein einziges Neuron nicht aus, um alle Apfelsorten anhand zweier Eingaben linear zu sepa- 

rieren. Mehrere Trenngeraden gemeinsam können die Aufgabe lösen. 

a Legen Sie die Trenngeraden so fest, dass alle Apfelsorten voneinander getrennt und 
unterscheidbar sind. 

b Begründen Sie, wie viele geeignete Apfelsorten durch 2 bzw. 3 Trenngeraden maximal 
unterschieden werden können. 


Allein sind die Einsatzmöglichkeiten des künstlichen Neurons auf Probleme der linearen Separa- 
tion beschränkt. Die Abbildungen zeigen drei Neuronen, die aufgrund zweier Eingaben die Ebe- 
ne jeweils in zwei Halbebenen teilen und dabei für eine Sortieranlage Schrauben eines gewissen 
Typs erkennen. 


1 -1 -1 


1 1 -5 
3 -3 -15 
erkennt lange Schrauben 


erkennt dünne Schrauben erkennt leichte Schrauben 


RE | | x = Ei | 
S z 
3 t | 4 . Lt 
x | 2 tl | | 
SIR | Treo 
ri + Zealeiai H reach 
Mt — + nr ja WER GER 
N | 2 I 1 
= S 1 A | | 
15 T 7 T ne 
N | va A - 1 1 7 - 
0 2 N aEa ol | 1 | (Auleimletmleı ale aleeleswle: 
| mm: pean | T .yEl Jane] Pass | T T T Amspzelme T T | Ps jStaEı pam T 


Deutlich leistungsfähiger ist es, wenn mehrere Neuronen 
zu einem neuronalen Netzzusammengeschaltet werden, 
um im Beispiel Schrauben zu erkennen, die gleichzeitig 
lang, dünn und leicht sind. Damit die drei gegebenen 
Neuronen die identischen Eingaben erhalten, verwendet 
man zwei besondere Neuronen in derEingabeschicht. Sie 
haben die Aufgabe, die Werte an eine Zwischenschicht 
unverändert weiterzuleiten. Das Gewicht beträgt also 1 
und der Schwellenwert 0. Eine Besonderheit ist hier die 
Aktivierungsfunktion, die nicht die bisherige Sprungfunk- 
tion ist, sondern die Gleichung y = x hat (Identitätsfunk- 
tion). 

In der Zwischenschicht entscheiden die drei Neuronen 
von oben jeweils über die Zugehörigkeit zu einer Halb- 
ebene. Auf der nächsten Schicht, die gleichzeitig schon 
die Ausgabeschicht ist, muss dann ein Neuron feststellen, 
ob alle drei Neuronen der vorangegangenen Schicht feu- 
ern. Mit den Gewichten 1 und einem Schwellenwert von 2,5 kann dies ermittelt werden: Wenn 
zwei (oder weniger) Neuronen feuern, so ergibt die Differenz aus gewichteter Eingabe und 


4.6 Gemeinsam sind Neuronen stark: Das neuronale Netz 


Schwellenwert den Wert -0,5 (oder weniger). Die Aktivierungs- - 
funktion liefert damit 0. 1] 
Genau bei drei feuernden Neuronen ergibt sich derWert 0,5 und ia, 
die Schwellenwertfunktion liefert damit den Wert 1. So ist ein IPSEN! 


neuronales Netz entstanden, das das Dreieck als Schnittmenge IR 
der drei feuernden Neuronen beschreibt und dadurch lange, | 
dünne und gleichzeitig leichte Schrauben erkennt. f} 


Durch Hinzunahme weiterer Neuronen können so kom- 
plexere Strukturen erkannt werden. 

Allgemein besteht ein neuronales Netz aus einer Einga- 
beschicht, einer oder mehreren Zwischenschichten und 
einer Ausgabeschicht, deren Neuronen jeweils ein Merk- 
mal erkennen. Die Neuronen einer Schicht geben ihr Si- 
gnal jeweils an alle Neuronen der nachfolgenden Schicht 
weiter. Neuronale Netze sind in ihren Anwendungsberei- 
chen sehr flexibel, auch beim unüberwachten und verstärkenden Lernen sind sie einsetzbar. 
Um komplexe Strukturen wie Bilder zu erkennen, bestehen Netze oft aus Millionen Neuronen in 
zahlreichen Schichten. Da das Netz im Gegensatz zu dem oben beschriebenen einfachen Beispiel 
automatisch lernt, ist in der Regel nur schwer nachvollziehbar, wie und warum ein neuronales 
Netz zu einer Entscheidung gelangt. 


Neuronale Netze können zur Identifikation komplexerer Strukturen genutzt werden und 
damit komplexe Probleme wie etwa Bilderkennung lösen. Ein neuronales Netz hat folgen- 
den Aufbau: 

« Die Eingabeschicht besteht aus Neuronen, die jeweils für ein Eingabemerkmal stehen 
und die die Werte unverändert weiterleiten. 

« Inden Zwischenschichten passiert die eigentliche Datenverarbeitung. Mehr Neuronen 
und Zwischenschichten erlauben die Lösung komplexerer Probleme bei höherem 
Rechenaufwand. 

- Auf der Ausgabeschicht gibt es für jedes Ausgabemerkmal ein Neuron. 


Aufgaben 


1 Richtig oder falsch? 

a Die Neuronen der Eingabeschicht haben eine beliebige Anzahl an Eingängen und ver- 
wenden als Schwellenwertfunktion die Sprungfunktion. 

b Die eigentliche Berechnung passiert in den Zwischenschichten. 

c Jedes Neuron leitet seinen Wert an jeweils genau ein Neuron weiter. 

d Drei Neuronen in der Ausgabeschicht sind notwendig, wenn es entscheiden soll, ob auf 
einem Foto ein Hund, eine Katze oder keines von beiden abgebildet ist. 

e Mit jedem neuronalen Netz können Daten allgemeiner - nicht nur linear - separiert wer- 
den. 

f Ein neuronales Netz darf maximal aus 12 Zwischenschichten bestehen. 

g Neuronen in der Eingabeschicht stehen für Merkmale, deren Werte sie jeweils unverän- 
dert an ein Neuron der Zwischenschicht weiterleiten. 


del 


Zum Vergleich: 
Ich habe ca. eine 
Million Neuronen. 


00 


Bei mir sind es bis 
zu 100 Milliarden! 


S 
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Hs ? 


Exklusives Oder: 
Entweder ich 
bestehe die 11. 
Klasse oder nicht. 
Beides gleichzeitig 
geht nicht. 
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Rollenspiel zum neuronalen Netz 

Fünf Freiwillige repräsentieren jeweils ein Neuron: Zwei sind Eingabeneuronen (EN), zwei sind 
auf der Zwischenschicht und eine Person macht die Ausgabe. Eine weitere Person protokolliert 
als Spielleiter an der Tafel die Eingaben und die jeweilige Ausgabe. Zur Verbindung dienen 
Schnüre, als Signale können leere Toilettenpapierrollen genutzt werden, jeweils beschriftet 
mit dem passenden Gewicht. 


a Erproben und diskutieren Sie die Zusam- 
menarbeit der Spielenden. Stimmt das 
Spiel mit einem realen Netz überein? 

b Begründen Sie, weshalb man das Netz als „Exklusives Oder”-Netz bezeichnet. Abstrahie- 
ren Sie in die übliche Darstellungsform des neuronalen Netzes. 


Rechnen wie ein neuronales Netz 

Das neuronale Netz von 5. 152 wurde so konstruiert, dass es im farbigen Dreieck (siehe S. 153 
oben) den Wert 1 liefert. Vollziehen Sie anhand der Simulation die Berechnung für die Punkte 
(0/0), (1]1), (1|0) und (0]2) nach und vergleichen Sie mit dem erwarteten Ergebnis. 


Grundaufbau neuronaler Netze 

a Begründen Sie mit eigenen Worten den Grundaufbau des neuronalen Netzes zur Begren- 
zung eines Dreiecks in der Ebene von S. 153. Begründen Sie außerdem, welche Gewichte 
und welcher Schwellenwert immer identisch gewählt werden können. 

b Beschreiben Sie analog den Aufbau eines möglichst einfachen neuronalen Netzes für ein 
Viereck in der Ebene. 

c Verbinden Sie die neuronalen Netze von a) und b) so, dass alle Punkte erkannt werden, 
die innerhalb des Vierecks oder des Dreiecks liegen. 

d Skizzieren Sie den grundsätzlichen Aufbau eines möglichst einfachen neuronalen Netzes, 
das einen Quader im dreidimensionalen Raum beschreibt. 


Neuronale Netze entwickeln 

Konstruieren Sie für die folgenden Problemstellungen selbst 

ein neuronales Netz. 

a Die rot gefärbte Fläche (s. Abbildung rechts) wird einge- 
schlossen von den Funktionen mit den Gleichungen 
y=x+lundy=--1. 

b Eine Maschine soll automatisch Bauteile sortieren. Aus- 
sortiert werden Bauteile, die kleiner als 0,9 cm oder grö- 
Ber als 1,1 cm sind sowie deren Gewicht kleiner als 49 q 
und größer als 51 9. 
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6 Gewichte im neuronalen Netz 
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Im Beispiel sind Gemüsesorten und Obstsorten aufgrund der enthaltenen Ballaststoffe und 
Proteine angetragen. Ein neuronales Netz soll passende Gewichte und Schwellenwerte erhal- 
ten, damit Gemüse und Obst möglichst gut unterschieden werden kann. Experimentieren Sie 
mit den Gewichten. Welche Strategie verfolgen Sie? Vergleichen Sie Ihre Strategien innerhalb 
der Klasse. Welche Strategie führte zur besten Lösung? 


7 Zuschauen, wie das neuronale Netz trainiert wird 


Im Kapitel wurde der Grundaufbau eines neuronalen Netzes betrachtet. Wie die einzelnen 

Neuronen ist auch das gesamte Netz lernfähig, aber anders als das einzelne Neuron in der 

Lage, komplexere Strukturen zu erkennen. Die Funktionsweise dieses Lernvorgangs ist nicht 

Inhalt gewesen, funktioniert aber ähnlich wie bei einem einzelnen Neuron: Aufgrund der Rück- 

meldung, ob das vom neuronalen Netz vorhergesagte Label korrekt ist, werden die Gewichte 

entsprechend aktualisiert. Über den Link in den Vorlagen können Sie ein neuronales Netzbeim 

Lernen beobachten. 

a Lassen Sie das neuronale Netz die kreisförmig angeordneten Daten lernen. Betrachten Sie 
die Ergebnisse der ersten Zwischenschicht (Maus darüber bewegen). Beschreiben Sie 
knapp das Ergebnis. 

b Äußern Sie begründet eine Vermutung, ob mit einer Zwischenschicht kreisförmig ange- 
ordnete Daten separiert werden können. Überprüfen Sie ihre Vermutung auch bei 
Variation der Anzahl der Neuronen der Zwischenschicht. 

c Nennen Sie den Wert, der die Qualität der Klassifikation angibt. Variieren Sie den Wert des 
Parameters Noise und erklären Sie den Einfluss auf die Qualität. 

d Experimentieren Sie mit weiteren Daten und Parametern und formulieren Sie Ihre Er- 
kenntnisse. 


8 Forschungsauftrag: Bilderkennung mit neuronalen Netzen 


Die Vorlage enthält ein Tutorial, mit dem sie selbst für den Appinventor eine Bilderkennungs- 
app entwickeln können. Bauen Sie diese nach und entwickeln Sie sie nach eigenen Ideen 
weiter. 


del 
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4.7 Klim Einsatz: Chancen und Risiken 


Künstliche Intelligenz verändert die Arbeitswelt 


Die Angst vor künstlicher Intelligenz ist häu- 
fig in die Zukunft gerichtet, mit starken Ro- 
botern, die den Menschen in allen Bereichen 
überlegen sind. Aber auch schwache, im Ein- 
satzgebiet eng begrenzte KI-Systeme haben 
bereits heute enormen - teilweise gewinn- 
bringenden, teilweise verhängnisvollen - 
Einfluss auf die Arbeitswelt. 

Die zunehmende Automatisierung und Glo- 
balisierung führte ab den 1980er Jahren dazu, 
dass vor allem einfache Tätigkeiten in Fabri- 
ken von Maschinen übernommen oder ins 
Ausland verlagert wurden. Autonome Syste- 
me in Lagerhäusern und Fabriken beschleu- 
nigen heute diesen Trend und sorgen dafür, 
dass die Löhne bei Beschäftigten ohne und 
mit geringer Ausbildung stark sinken, weil sie 
mit günstigeren Maschinen konkurrieren. 
Auch in Versicherungen, Banken und Büros 
findet eine zunehmende Automatisierung 


a Recherchieren Sie arbeitsteilig für ver- 
schiedene Berufe, inwieweit Automati- 
sierung und künstliche Intelligenz be- 
stimmte Berufe (vielleicht solche, die 
Sie in Zukunft ergreifen wollen) verän- 
dert haben und in Zukunft verändern 
werden. Lassen sich Berufsfelder identi- 
fizieren, die wenig/viel von Kl beein- 
flusst werden? 

b Diskutieren Sie mit verteilten Rollen 
(Mitarbeitende in verschiedenen Berei- 
chen eines Unternehmens (Büro, Ferti- 
gung), Betriebsrat, Unternehmenslei- 
tung, Kl-Entwicklungsteam, 
Personalleitung) in einem Rollenspiel, 
aus welchen Gründen und wie ein Un- 
ternehmen durch Kl-Techniken weiter- 
entwickelt werden sollte. 

c Diskutieren Sie Vor- und Nachteile, 
wenn Kl-Systeme (z.B. in der Medizin 
oder bei Stellenausschreibungen) Ent- 
scheidungen vorbereiten oder treffen. 


statt; so werden Texte maschinell vorüber- 
setzt, ehe z. B. eine menschliche Übersetzerin 
(momentan noch) eine Überprüfung auf 
Korrektheit vornimmt, Versicherungs- und 
Kreditanträge werden automatisch bearbei- 
tet, nur bei Einsprüchen gegen die Entschei- 
dung der Maschine wird der Vorgang noch 
von Hand geprüft. Auch bei der Auswahl von 
Bewerbungen auf freie Arbeitsstellen werden 
inzwischen KI-Systeme eingesetzt, die auf- 
grund der Daten der aktuell Beschäftigten 
über die Qualität von Bewerbungen und die 
Einladung zu _Bewerbungsgesprächen 
entscheiden. 

Werden am Ende nur noch die Maschinen 
entscheiden und viele Menschen arbeitslos 
sein und in Armut leben? Oder wird diese 
Entwicklung dazu führen, dass wir alle bei 
gleichem Wohlstand weniger arbeiten 
müssen? 


d Benennen Sie außerdem Berufsfelder und Situationen, in denen Kl-Systeme voraussicht- 
lich auch in Zukunft unterlegen sein werden, und begründen Sie ihre Einschätzung. 

e Gesellschaftlich wird im Kontext von immer mehr automatisierter Arbeit die Frage 
nach einem bedingungslosen Grundeinkommen diskutiert. Recherchieren Sie, was 
dies bedeutet und welche Vor- und Nachteile es impliziert. 


4.7 Klim Einsatz: Chancen und Risiken 


Entscheidungen der Kl überlassen 

Kl-Verfahren werden in immer mehr Bereichen unseres Lebens eingesetzt, beispielsweise in au- 
tonomen Fahrzeugen, bei Diagnosen in der Medizin und bei der Bildauswertung von Überwa- 
chungskameras im öffentlichen Bereich. Mit so vielfältigen Einsatzszenarien entstehen auch 
Fragestellungen persönlicher und gesellschaftlicher Tragweite. Gleichzeitig ist der Einsatz von 
Kl-Systemen mit Angst verbunden. Diese prägt oft öffentliche Debatten, auch wenn dort Sach- 
lichkeit wünschenswert ist. 


Wie hoch ist denn Hängt von der Art des Menschen sind 
die Fehlerrate so Verfahrens ab, von den Daten, auch nicht 


einer KI? z.B. der Bildqualität, ... unfehlbar. Über 


@ ] ?00 schwere 


Behandlungsfehler 


im letzten Jahr laut 


Bundesärztekammer. 
Chancen und Risiken von Kl bewerten 
Damit der Einsatz von Kl-Systemen verantwortungsvoll und gewinnbringend geschieht, haben 
Fachleute einige wichtige Kriterien festgelegt, die als Bewertungsmaßstab für aktuelle und zu- 
künftige KI-Systeme dienen können: 


Und dann gibt es unterschiedliche 
Fehlertypen: Wird ein Hautkrebs 
von der Kl nicht erkannt? Wird bei 
einem Patienten irrtümlich ein Krebs 
diagnostiziert? 


« Fairness 
Kl-Systeme können enormen Einfluss auf die Teilhabechancen von Menschen haben. Wichtig 
ist daher, dass diese Systeme fair und frei von Vorurteilen handeln. Dabei sind jedoch nicht die 
Systeme selbst voreingenommen. Oft sind es die Daten, die zum Training verwendet wurden. 


« Nachvollziehbarkeit von Entscheidungen 
Entscheidungen von KlI-Systemen müssen nachvollziehbar sein, etwa wenn Entscheidungen 
über einen Kredit oder eine Bewerbung getroffen werden. Dabei muss zwischen Transparenz 
und Erklärbarkeit unterschieden werden: Erklärbarkeit bedeutet, dass wesentliche Argumen- 
te für eine Entscheidung benannt werden können, für Transparenz muss das Verhalten voll- 
ständig nachvollziehbar sein. Gerade bei datenbasierten Ansätzen und insbesondere neuro- 
nalen Netzen ist die Transparenz häufig schwer herzustellen. 


Effizienzsteigerung, neue Möglichkeiten 

Eine bessere Gesundheitsversorgung, gleicher Ertrag in der Landwirtschaft bei höherer Um- 
weltverträglichkeit, ... - es war schon immer Ziel der Menschheit, sich weiterzuentwickeln. 
Deshalb ist es auch ein wichtiges Bewertungskriterium für den Einsatz einer Kl, welche Vortei- 
le, neuen Ansätze und Verbesserungen sie im konkreten Fall bringt. 


Zuverlässigkeit 
Welche Anforderungen muss das Kl-System erfüllen? Muss dass es bei datenbasierten 


die Kl z. B. Gummibärchen nach Farbe sortieren, genügt Be ehe de von 
eine Zuverlässigkeit von 75 %, damit die Kundschaft nicht BP Ingeripraxisinie L E 
merkt, dass eine Farbe in der Packung dominiert. Bei selbstfahrenden Autos ® 
würden 75 % Zuverlässigkeit dagegen durchschnittlich einen Unfall an KB» 
= 


jeder vierten Kreuzung bedeuten, hier muss die Zuverlässigkeit praktisch 
100 % sein. 
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4.7 Klim Einsatz: Chancen und Risiken die 


del 


4 Künstliche Intelligenz 


Fee Tuer en 2 Richtig oder falsch? & @ 
Entscheiden Sie und begründen Sie knapp Ihre Entscheidung. 
a Die Nachvollziehbarkeit von Ergebnissen einer Kl ist bei wissensbasierten Systemen deut- 
A lich höher als bei datenbasierten. 
Max, hast du gehört, | (>> b Der Einsatz von Kl verbessert und vereinfacht Prozesse in Unternehmen und im Alltag. 
... (e) \ EN c Wird beim überwachten Lernen ein KI-System nicht nur durch Trainingsdaten trainiert, 
Auto in einen LKW NM - - sondern auch danach durch Testdaten überprüft, ist das Klassifizieren von neuen Daten 
gekracht ist? N] Ba NS N durch dieses System zuverlässig. 
Trainingsdaten. d Es ist sinnvoll, bei Gerichtsurteilen eine Kl einzusetzen, weil so anders als bei Richterinnen 
\ | | und Richtern unabhängig von Vorurteilen, persönlichen Erfahrungen usw. neutral ent- 
schieden wird. 


- Verantwortlichkeit 
Wer trägt die Verantwortung, wenn Entscheidungen nicht mehr von Menschen, sondern der 
Kl getroffen werden? Und wer haftet bei Fehlern? Wenn ein Programm irrt, dann irrt meistens 
die Programmiererin oder der Programmierer. Oder die Daten, mit denen ein System trainiert 
wurde, waren unzureichend. Deshalb ist es wichtig, dass die Systeme kontrolliert werden. 
Idealerweise erfolgt dies anhand konkreter Normen, die in einem interdisziplinären Dialog mit 
informatischer, rechtlicher und ethischer Expertise entstanden sind. 


3 Schlaue Köpfe zum Thema Kl ii 8 ap) 
Bewerten und diskutieren Sie die folgenden Zitate zum Thema Kl: 


A year spent in artificial intelligence is 
enough to make one believe in God. 
‚Alan Perlis, Erster Preisträger des 
Turingpreises, 1982 


Machines il 
Will be ca, i 
years, of doing any — Koh n 
Cando, 


Herbert sj 
ne a Nobelpreisträger fü 
' Turing, Yeisträger, 1965 ; 


Ingp 


« Privatsphäre 
Eine der Grundregeln des Datenschutzes ist die Datensparsamkeit. Daten sollen nur dort er- 
hoben werden, wo dies gut begründet ist. Dabei sind die Interessen der Einzelnen angemessen 
zu berücksichtigen. 


In from three to eight years we will have a machine with 
the general intelligence of an average human being. 


Marvin Minsky, Turingpreisträger („Nobelpreis der Informatik”), 1970 


Der Einsatz künstlicher Intelligenz hat einerseits ein hohes Potenzial, weil umfangreiche 
Aufgaben effizient bearbeitet und neue Möglichkeiten erschlossen werden können. Ande- 


4 Verbreitung von Fehlinformationen 8 & 


RAR 


rerseits bergen KI-Systeme auch Risiken, insbesondere hinsichtlich der Zuverlässigkeit, der 
Nachvollziehbarkeit ihrer Entscheidungen, der Verantwortlichkeit, der Achtung der Pri- 
vatsphäre und der Fairness. Diese Aspekte müssen als Leitlinien bei der Entwicklung und 
dem Einsatz von Kl-Systemen bedacht und kontrolliert werden. 


Aufgaben 


1 Einsatzbereiche von künstlicher Intelligenz 
Sammeln und recherchieren Sie Bereiche, in denen Kl eingesetzt wird. Ergänzen Sie dazu in 
Ihrem Heft die Mindmap um diese Einsatzbereiche. Der Überblick verdeutlicht die Vielseitigkeit 
der Anwendungen und kann bei den folgenden Aufgaben helfen, Chancen und Risiken ein- 
zuordnen. 


Zeitreihenanalyse 


—n 


iR Wetterprognose 
€ Kl-Einsatzbereiche \ = 
) 


Mustererkennung 


Spracherkennung 


Dass Menschen nicht immer die Wahrheit 
sagen, ist bekannt. So wurden dem ehemali- 
gen US-Präsidenten Trump während seiner 
Amtszeit von 2016 bis 2020 über 22000 
Falschaussagen zugeschrieben. 

Doch können auch Maschinen lügen? KI- 
Systeme können zumindest zur Verbreitung 
von Fehlinformation beitragen. Social Bots, 


Deepfakes sind realistisch wirkende Bilder, 
Audio- und Videoclips, die durch Einsatz 
von KI-Techniken gezielt verändert und ver- 
fälscht werden. 

So veröffentlichte etwa das MIT Center for 
Advanced Virtuality ein Deepfake in Bild 
und Ton, in dem der frühere US-Präsident 
Nixon eine Rede über den Tod der Apollo-11 


>53 


die sich als Profile echter Menschen in Astronauten verlas. Die 
sozialen Netzwerken ausgeben und versu- Rede wurde vor der 
chen, bestimmte Mission geschrieben, 
Meinungen zu ver- aber nie gehalten, da 
breiten, gibt es nicht die Mission erfolgreich 
nur in totalitären beendet wurde. 

oder autokratischen 
Systemen, sondern 
auch bei uns. 


a Suchen Sie nach dem erwähnten Video und finden Sie heraus, wie und zu welchem Zweck 
es zustandegekommen ist. Gehen Sie dabei auch auf Gestik, Mimik und Stimme ein. 

b Entwickeln Sie ein Szenario, in denen Social Bots und Deepfakes zur Manipulation von 
Meinung eingesetzt werden könnten. Diskutieren Sie Möglichkeiten, um solche Szenarien 
zu erkennen und ihnen entgegenzuwirken. 

c Recherchieren Sie reale Fälle zu Deepfakes. Beschreiben Sie Folgen für Täterinnen bzw. 
Täter und Opfer. 


159 


160 


del 


4 Künstliche Intelligenz 


ii @ 5 Entscheidungen der Kl überlassen 


In immer mehr Einsatzbereichen gibt es be- 
reits KI-Systeme, die ein spezifisches Prob- 
lem im Durchschnitt besser lösen als die 
besten menschlichen Fachkräfte. Dabei wird 
oft darüber hinweggeblickt, dass auch die 
besten KI-Systeme Fehler machen können. 


—— G 


So könnte etwa die Bilderkennung am Flug- 
hafen eine Passagierin zu Unrecht als Terro- 
ristin einstufen, oder eine Medizin-KI eine 
falsche Behandlung mit potentiell katastro- 
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phalen Folgen empfehlen. Vermutlich wird 
daher in diesen Einsatzszenarien auch in 
Zukunfteine menschliche Expertise wichtig 
bleiben. Doch wer trägt die Verantwortung 
für die KI-gestützten Entscheidungen eines 
selbstfahrenden Autos? Im Extremfall kann 
eine autonom agierende KI hier Leben ret- 
ten, z. B. wenn ein Fahrassistenzsystem eine 
Gefahr erkennt und die Bremsung einleitet, 
noch bevor ein Mensch am Steuer über- 
haupt reagieren könnte. Genauso könnte 
der KI des Fahrzeugs aber auch ein fataler 
Fehler unterlaufen, ohne dass den Passagie- 
ren im Fahrzeug Zeit bleibt, diesen zu kor- 
rigieren. Dass dies eine reale Gefahr ist, 
zeigen die vielfältigen Medienberichte über 
schwere Unfälle selbstfahrender Autos, bei 
der die Unfallursache eine folgenschwere 
Fehlentscheidung des „Autopiloten“ war. 


6 Klals „Black Box” 


Auch wenn KI im Allgemeinen noch nicht 
die menschliche Intelligenz ersetzen kann, 
ist die Tatsache, dass bei KI-basierten Ent- 
scheidungen kein Mensch beteiligt ist, für 
manche Anwendungsgebiete gegebenenfalls 
sogar ein Vorteil. Bei der Zuteilung von 
Spenderorganen oder der Auswahl von Be- 
werbungen für eine Arbeitsstelle könnten 
durch eine rein KI-basierte Entscheidung 
beispielsweise Vorwürfe von unerwünsch- 
ten „menschlichen Einflussfaktoren“ wie 
etwa Diskriminierung (aufgrund von Ge- 
schlecht, Hautfarbe usw.), Bestechlichkeit 
etc. von vorneherein ausgeräumt werden - 
scheinbar zumindest. 


4.7 Klim Einsatz: Chancen und Risiken 


Denn hier ergibt sich schnell ein Henne-Ei- 
Problem: Für einfache wissensbasierte An- 
sätze sind derartige Problemstellungen in 
der Regel zu komplex und für maschinelles 
Lernen stehen nur von Menschen getroffene 
Entscheidungen als Trainingsdaten zur Ver- 
fügung. Doch eine so angelernte KI würde 
anschließend auch „wie ein Mensch“ Ent- 
scheidungen treffen. Hinzu kommt, dass 
derart schwierige Fragestellungen in der 
Regel auch nur von sehr komplexen KI- 
Strukturen bearbeitet werden können, bei 
denen am Ende nur schwer nachvollziehbar 
ist, welche Einflussfaktoren zu einer Ent- 
scheidung beigetragen haben. 


Recherche- und Diskussionsaufträge: 

a Ein wichtiger Bestandteil autonomer Fahrzeuge ist ein KI-System, um Verkehrszeichen in 
Kamerabildern zu erkennen und korrekt zu interpretieren. Recherchieren Sie wissen- 
schaftliche Daten zur Treffergenauigkeit dieser Systeme und diskutieren Sie, inwieweit die 
Werte für den Alltagseinsatz in selbstfahrenden Autos ausreichend erscheinen. 

b Suchen Sie im Internet nach der vom MIT entwickelten „Moral Machine“. Dort können Sie 
für verschiedene Verkehrssituationen überlegen, wie sich ein selbstfahrendes Auto ver- 
halten sollte, und Ihre Entscheidung mit der von Anderen vergleichen. 

c Ein autonom fahrender PKW verursacht einen Unfall, bei dem eine Radfahrerin schwer 
verletzt wird. Im Rahmen der juristischen Aufarbeitung des Unfalls soll die Schuldfrage 
und der Schmerzensgeldanspruch der Radfahrerin geklärt werden. 

i Suchen Sie in Gruppen Informationen zur aktuellen Rechtslage (z. B. StVG $1e-g, 7 und 
8). Die verschiedenen Rechtsvorschriften sind teils recht umfangreich; teilen Sie sich 
die Arbeit innerhalb der Gruppe sinnvoll auf! Sammeln und diskutieren Sie anschlie- 
ßend Ihre Erkenntnisse, inwieweit die Fahrerin des PKW und/oder der Hersteller laut 
der betrachteten Rechtsvorschriften als Schuldige infrage kommen. 

ii Alternativ wäre auch denkbar, durch selbstfahrende PKW verursachte Unfälle als „hö- 
here Gewalt” (vgl. StVG 87, Absatz 2) anzusehen. Diskutieren Sie das Für und Wider ei- 
ner solchen Einordnung am oben beschriebenen Beispiel. 

Beschreiben Sie, was StVG $1e, Absatz 2, Nummer 2c in der Praxis bedeutet, und disku- 

tieren Sie, welche alternativen Lösungen für das dort beschriebene Problem denkbar 

wären. Stellen Sie ferner eine Vermutung auf, weshalb sich diese im Gesetzgebungs- 
prozess nicht durchgesetzt haben. 


a Angenommen, das Kultusministerium entwickelt ein Kl-System, um Aufsätze im Fach 
Deutsch automatisiert zu bewerten. In einer groß angelegten Studie stellt sich heraus, dass 
Fachleute, Schülerinnen und Schüler sowie Lehrkräfte allesamt die vom KI-System vergebe- 
nen Noten als passender und fairer einschätzen als die parallel für die gleichen Aufsätze von 
menschlichen Lehrkräften vergebenen Noten. Im Gegensatz zu menschlichen Lehrkräften 
kann das Kl-System aber nicht begründen, wie es zu einer bestimmten Note gekommen ist. 
Diskutieren Sie, ob sie unter diesen Voraussetzungen das Kl-System oder menschliche Lehr- 
kräfte für die Bewertung ihrer Schulaufgaben im Fach Deutsch bevorzugen würden. 

b Lesen Sie $14, Absatz 2g sowie 822 der europäischen Datenschutz-Grundverordnung 
(DSGVO) und beschreiben Sie, wie dort die Kl-basierte Datenverarbeitung durch Dritte 
gesetzlich geregelt ist. 

c In verschiedenen Studien konnte gezeigt werden, dass es Menschen offenbar weniger 
schwerfällt, als peinlich empfundene Krankheitsbilder mit einem anonymen Kl-System zu 
„besprechen“ als mit einer menschlichen Ärztin oder einem menschlichen Arzt. Erläutern 
Sie mögliche Gründe für diese Beobachtung und beschreiben Sie, wie diese Erkenntnis 
zukünftig in der Medizin genutzt werden könnte. 


Nachvollziehbarkeit von Kl-Systemen 

Ein wichtiger Aspekt bei Kl-Systemen ist deren Nachvollziehbarkeit. Vergleichen Sie dahinge- 
hend die Verfahren k-nächste-Nachbarn, Entscheidungsbaum und künstliches neuronales 
Netz. 


Zukunftswerkstatt „Kl in 20 Jahren” 

Sammeln Sie Thesen, Ideen und Erwartungen, wie sich Kl in den kommenden 20 Jahren auf 
Arbeitswelt, Technik und Gesellschaft auswirken wird. Benennen Sie Chancen, Probleme und 
Lösungsideen. Treten Sie innerhalb der Klasse dazu in Austausch. 


Forschungsauftrag: Starke Kl 

Recherchieren Sie, wie der aktuelle Forschungs- und Entwicklungsstand zum Thema „starke 
Kl” ist. Eine Suche nach allgemeine künstliche Intelligenz (artificial general intelligence) könn- 
te ebenfalls hilfreich sein. 
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dich Teste dich selbst! 


Teste dich selbst 


T1 Richtig oder falsch? 

Beurteilen Sie, ob folgende Aussagen richtig oder falsch sind. Begründen Sie Ihre Meinung 

bei falschen Aussagen und geben Sie eine berichtigte Aussage an: 

a Da um das Jahr 2010 mehrere starke Kl-Systeme entwickelt wurden, existieren schwache 
Kl-Systeme kaum noch. 

b Bei unüberwachtem Lernen sind große Datenmengen notwendig. Dabei ist es wichtig, 
dass die Daten über Label verfügen. 

c Ein Beispiel für überwachtes Lernen ist der k-Nächste-Nachbarn-Algorithmus. 

d Zur linearen Separation benötigt man ein neuronales Netz mit mindestens drei 
Schichten. 

e Die Neuronen der Eingabeschicht leiten die Werte unverändert an alle übrigen Neuro- 
nen weiter. 

f Nachvollziehbarkeit eines Kl-Systems bedeutet, dass man in allen Details begründen 
kann, wie das System entscheidet. 


T2 Ich check’s, dank deiner Hilfe! 

Ferdi hat im Unterricht nicht gut aufgepasst und braucht dringend Ihre Nachhilfe vor der 
alles entscheidenden letzten Prüfung. Helfen Sie ihm, indem Sie ihm die folgenden Begriffe 
an einem Beispiel erklären: 

Starke und schwache Kl; überwachtes Lernen; maschinelles Lernen; wissensbasierte versus 
datenbasierte Kl; k-Nächste-Nachbarn-Algorithmus; Entscheidungsbaum-Lernen; Trai- 
nings-, Validierungs- und Testdaten; Hyperparameter; künstliches Neuron (Berechnung und 
Lernvorgang); neuronales Netz 


T3 Künstliche Intelligenz 
a Begründen Sie, warum ein Sprachlexikon als künstliche Intelligenz bezeichnet werden 
kann. Verwenden Sie passende Fachbegriffe. 


E u B u ai - 
+ | 
Sonntag domingo 
— u u aus: _ 
gelb amarilo 


b Nennen Sie Beispiele für wissensbasierte und datenbasierte Kl-Systeme. 


T4 


T4 


T5 


Teste dich selbst! die 


Überwachtes Lernen (Alternative 1: k-Nächste-Nachbarn-Algorithmus) 
a Ein neuer Datenpunkt (schwarzer Kreis) soll gelabelt 

werden. Bestimmen Sie für folgende Werte von k, wel- 

ches Label (orange/ violett) einem neuen Datenpunkt 

(schwarzer Kreis) nach dem k-Nächste-Nachbarn- 5 . . 

Algorithmus zugeordnet wird: 

1 ii 3 ii 4 ° * 
b Beschreiben Sie, auf welche Weise der für dieses Sze- en 

nario beste Wert für k ermittelt werden kann. ° . 


Überwachtes Lernen (Alternative 2: Entscheidungsbaumlernen) 
Ein Entscheidungsbaum soll für 
fiktive Teilchen vorhersagen, ob 
sie abhängig von dem Vorhan- 
densein eines Kerns und der Kern? 
Form (Kreis oder Viereck) stabil 


(blau) oder instabil (rot) sind. (NEIN ) 

a Begründen Sie knapp, nach 
welchem Kriterium der Ent- 
scheidungsbaum beim Ler- 2% 
nen eines Entscheidungsbau- 


mes allgemein gebildet wird. 
b Begründen Sie knapp (ohne 
Rechnung!), welcher der beiden Entscheidungsbäume einen korrekten Zwischenschritt 
darstellt. 
c Beurteilen Sie, ob es sich bei der Auswahl des ersten Entscheidungsmerkmals (hier Kern 
vs. Form) um einen Hyperparameter handelt. 


Angst vor Kl? 
In der gesellschaftlichen Diskussion gibt es häufig Ängste vor Kl. Nehmen Sie differenziert 
Stellung. 


Kl trifft 
Entscheidungen, 
die für uns nicht 
nachvollziehbar 
sind. 


Kl klaut unsere 
Arbeitsplätze! 


Wozu noch das Abi machen? 
Maschinen sind bald schlauer als 
wir und erledigen alle Arbeiten. 
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FE 


Zusammenfassung 


Zusammenfassung 


Künstliche Intelligenz (Kl) be- 
schreibt Programme, die mensch- 
liches Denken und Handeln nach- 
ahmen bzw. in der Lage sind, 
rational zu denken und/oder zu 
handeln. Eine allgemeingültige 
Definition von Kl gibt es jedoch 
nicht. 

Alle heute existierenden Beispiele 
für Kl sind Vertreter sogenannter 
schwacher KI-Systeme, die nur 
eine bestimmte Aufgabe lösen 
können. 


Eine starke Kl hingegen würde 
über eine dem Menschen eben- 
bürtige Intelligenz verfügen oder 
diese sogar noch übertreffen. 


Schwache Kl 


Gerne! Um wie viel Uhr 
möchtest du vorbei kommen? 


® 


® 


Für wie viele Personen? 


Das passt! Auf welchen Namen 
darf ich den Tisch reservieren? 


® 


Starke Kl 


Fiktion: 


Danke für die Reservierung. 
Bis Samstag 19 Uhr! 
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Der k-Nächste-Nachbarn-Algorith- 
mus ist ein überwachtes Lernverfah- 
ren, das für einen Datenpunkt unter 
Berücksichtigung seiner k nächsten 
Nachbarn ein Label vorhersagt. 


Das Lernen von Entscheidungsbäu- 
men ist ein überwachtes Lernverfah- 
ren, bei dem die Daten schrittweise 
anhand der Merkmale mit dem 
höchsten Informationsgewinn auf- 
geteilt werden, bis keine Merkmale 
zur Unterscheidung mehr vorliegen 
oder alle Datensätze dasselbe Label 
aufweisen. 


Merkmal 2 


zu beschriftender 
Datenpunkt 


Merkmal 1 


Zusammenfassung 


de 


Es gibt viele verschiedene Mög- 
lichkeiten Kl zu realisieren: Bei 
wissensbasierten Ansätzen wer- 
den (Experten-)Wissen, Regeln 
oder Strategien z. B. in Tabellen 
und Entscheidungsbäumen ge- 
speichert und verwendet bzw. 
durchsucht. Datenbasierte An- 
sätze nutzen hingegen Datenbe- 
stände, um selbst z. B. Regeln für 
Beschriftungen, Gruppierungen 
in den Daten oder vorteilhafte 
Aktionen zu finden. Man spricht 
daher auch von maschinellem 
Lernen. 


Tabellarisches 
Wissen 


Wissensbasierte 
Ansätze 


Logisches 
Schließen 


Datenbasierte 
Ansätze 
> 
Überwachtes | | Unüberwachtes 
Lernen Lernen 


Verstärkendes 
Lernen 


Für das Training eines Systems zum 
maschinellen Lernen werden Trai- 
ningsdaten mit möglichst aussage- 
kräftigen Merkmalen benötigt. Ein 
Teil der verfügbaren Daten sollte 
aber als Validierungs- und Testdaten 
zurückgehalten werden. Neben der 
Merkmalsauswahl hat auch die 
Optimierung lernalgorithmusspezi- 
fischer Hyperparameter Einfluss auf 
die Güte des Kl-Systems. Dabei soll- 
ten die Hyperparameterwerte ge- 
wählt werden, welche zu einer 
optimalen Klassifikation der Validie- 
rungsdaten führen. Durch eine un- 
geeignete Merkmalsauswahl oder 
unpassende Hyperparameterwerte 
kann es zu Overfitting oder Under- 
fitting kommen. Eine abschließende 
Beurteilung der Güte des Kl-Systems 
ist schließlich anhand der Testdaten 
möglich. Für Trainings-, Validierungs- 
und Testdaten muss somit das kor- 
rekte Klassifikationsergebnis vorab 
bekannt sein. 


Testdaten 


System testen 


System trainieren 
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PER 


Zusammenfassung 


Ein künstliches Neuron ist eine Funktion, die 
abhängig von gewichteten Eingaben und ei- 
nem Schwellenwert den Wert 1 (Aktivierung) 
oder O (keine Aktivierung) ausgibt und da- 
durch zwei geeignete Label linear separiert. 


Das Perzeptron als Erweiterung des künstli- 
chen Neurons beherrscht einen einfachen 
Klassifikationsalgorithmus, bei dem das Neu- 
ron durch eine schrittweise Anpassung der 
Gewichte und des Schwellenwertes lernen 
kann, das richtige Label zu vergeben. 
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Berechnung mit dem Term x; - wı +%X3:W; -5 


x 1 


7 


x =4,%=2>4:-(-1)+2-5-7<0,Neuron liefert 0. 
x =23,% =3>2-(-1)+3-5-7>0,Neuron liefert 1. 


Gewichtsanpassung nach der Delta-Lernregel 

Waeu = Wair + a (Labelwert-berechnetes Ergebnis) - Eingabe 
bzw. 

Sneu= Sa a (Labelwert-berechnetes Ergebnis) - 1 


Neuronale Netze haben folgenden Aufbau: 

» Die Eingabeschicht besteht aus Neuronen, 
die jeweils für ein Eingabemerkmal stehen 
und die die Werte 
unverändert weiterleiten. 

« Inden Zwischenschichten passiert die ei- 
gentliche Datenverarbeitung. Mehr Neuro- 
nen und Zwischenschichten erlauben die 
Lösung komplexerer Probleme bei 
höherem Rechenaufwand. 

» Auf der Ausgabeschicht gibt es für jedes 
Ausgabemerkmal ein Neuron. 


Der Einsatz künstlicher Intelligenz hat einer- 
seits ein hohes Potenzial, weil umfangreiche 
Aufgaben effizient bearbeitet und neue Mög- 
lichkeiten erschlossen werden können. Ande- 
rerseits bergen Kl-Systeme auch Risiken, insbe- 
sondere hinsichtlich der Zuverlässigkeit, der 
Nachvollziehbarkeit ihrer Entscheidungen, 
der Verantwortlichkeit, der Achtung der Pri- 
vatsphäre und der Fairness. Diese Aspekte 
müssen als Leitlinien bei der Entwicklung und 
dem Einsatz von Kl-Systemen bedacht und 
kontrolliert werden. 


Eingabeschicht Ausgabeschicht 
z S 


Effizienzsteigerung Fairness 
Zuverlässigkeit Verantwortlichkeit 


Zum Weiterlesen 


Zum Weiterlesen 


L7 Geschichte der Kl 
Obwohl künstliche Intelligenz oft mit den jüngsten Entwicklungen der Informatik assoziiert wird, 
ist das Feld der Kl bereits deutlich älter und reicht bis weit ins letzte Jahrtausend zu den Anfängen 
der Informatik zurück. 

Damals bestand aber noch längst keine Einigkeit über die Bezeichnung. Für das, was wir heute 
unter künstlicher Intelligenz verstehen, existierten mit Kybernetik oder komplexer Informations- 
verarbeitung auch eine Reihe weiterer Begriffe. Die sechswöchige Dartmouth-Konferenz 1956 
sollte schließlich nicht nur die Forschung in diesem Bereich, sondern mit,künstlicher Intelligenz“ 
auch dessen Namen prägen. Unter denThemen schon damals waren künstliche neuronale Netze. 
Selbst der erste Chatbot ist schon älter als man gemeinhin annehmen möchte. Der Informatiker 
Joseph Weizenbaum entwickelte 1966 am MIT mit ELIZA 
den ersten Chatbot, der mit einfachen Methoden die Rol- 
le eines Psychotherapeuten mimte. So konnte sein Pro- 
gramm auf bestimmte Schlüsselwörter reagieren und 
versuchte ansonsten mit allgemeinen Phrasen zu antwor- 
ten. 


Die Computer damals verfügten allerdings nicht annä- 
hernd über die Rechenleistung heutiger Systeme. Trotz 
einiger bedeutender Erfolge, wie dem Expertensystem 
MYCIN (vgl. Kapitel 4.2), fiel das Feld zweimal in eine Art 
Winterschlaf, in der Investitionen aufgrund von hinter den 
Erwartungen zurückgebliebenen Fortschritten zurückge- 
fahren wurden. Ab dem Höhepunkt des zweiten KI-Win- 
ters zu Beginn der 1990er Jahre kam dem Themenbereich 
künstliche Intelligenz wieder mehr Aufmerksamkeit zu. 
Besonders aber seit den 2010er Jahren explodierte das 
Interesse: Insbesondere Fortschritte im Bereich des ma- 
schinellen Lernens, etwa in der Bilderkennung, befeuer- 
ten die Entwicklung. Doch auch heute gibt es noch genü- 
gend Herausforderungen, die gemeistert werden können 
und das Feld auch in den nächsten Jahren interessant halten dürften. 


L8 Neuronale Netze zur Bilderkennung 

Dem menschlichen Auge fällt es leicht, ein Bild von einer Couch von dem Bild einer Uhr zu un- 
terscheiden. Im Rechner sind die Bilder aber durch die Farbwerte der einzelnen Bildpunkte re- 
präsentiert. Wie kann in solchen Bildern festgestellt werden, was darauf abgebildet ist, obwohl 
sie sich in unzähligen Faktoren unterscheiden (Helligkeit, Schärfe, Design und Entfernung des 
Gegenstands, von vorn/von der Seite...)? 

In Kapitel 4.6 wurde gezeigt, wie einfache Strukturen (z. B. Bildpunkte eines Dreiecks) mit Hilfe 
eines einfachen neuronalen Netzes erkannt werden können. Um komplexe Strukturen zu erken- 
nen, werden sogenannte Convolutional Neural Networks („gefaltete neuronale Netze“) verwen- 
det, die oft aus Millionen von Neuronen bestehen und mit einer großen Anzahl an Trainingsdaten 
für alle zu erkennenden Labels „gefüttert werden‘. 


dich 
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4 Künstliche Intelligenz 


5 Vertiefung: Projekte 


Solche Netze bestehen aus drei Arten von Schichten: 

1. Convolution-Schicht: Das Bild wird aufgeteilt in einzelne Bereiche. In diesen Bereichen wer- 
den Strukturen wie Linien, Ecken u.s.w. erkannt. 

2. Pooling-Schicht: Die Information aus der Convolution-Schicht wird auf wesentliche Informa- 
tion reduziert, um die Datenmenge zu reduzieren. Dies kann man sich vorstellen wie einen 
Filter, den man in einer Foto-App nutzt, um beispielsweise ein Bild in eine schwarz-/weiß- 
Darstellung umzuwandeln. 


Nun wechseln sich mehrere Convolution- und Pooling-Schichten ab, wodurch immer komplexe- 
re Strukturen erkannt werden können. Aus Linien werden Rechtecke, Kreise, ... identifiziert, aus 
denen wieder komplexere Muster erkannt werden. 


Ein Kreis mit zwölf kurzen Linien am 
Rand und zwei langen Linien in der U 
Mitte? Könnte eine Uhr sein! 


3. Abschließend kommt die vollständig verknüpfte Schicht, die die erkannten Strukturen mit 
den Ausgabelabels verknüpft. 


Neben dem Einsatz bei der Bilderkennung werden Convolutional Neural Networks nicht nur in 
der Bilderkennung, sondern beispielsweise auch beim Erkennen natürlicher Sprache eingesetzt. 


168 


w_ 


media/screenshots/SCR-20240910- 
phpl.png 


5 Vertiefung: Projekte 


5.0 Projektmanagement 


>? iterare: lat. 
wiederholen 


> Prototyp: 
funktionsfähiges 
Produkt, das 
fehlerfrei ist, jedoch 
nicht den vollen 
Funktionsumfang 
hat. 


> agile: engl. 
wendig, beweglich 
(weil zu Beginn 
jeder Iteration die 
Schwerpunkte neu 
gesetzt werden 
können) 
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5.0 Projektmanagement 


Planung, Kommunikation und Transparenz als Schlüssel zum Erfolg 
Projekte werden meist im Team bearbeitet, [6 T= 
weildieFertigstellungsonstzulangedauern ze ©le 
würde und unterschiedliche Erfahrungen = T AMAf 
und Sichtweisen Einzelner dabei helfen, 2 7 \ \ 
komplexe Aufgabenstellungen zu lösen. n Paaren implementieren : | 
Eine typische Organisationsform besteht 
aus sich wiederholenden festen Zeitfens- 
tern (>Iterationen), in denen das Team 
einen >Prototyp jeweils um weitere Funk- 
tionalitäten ergänzt. Jede Iteration umfasst 
« eine Planungsphase, in der das Ziel des 
aktuellen Durchlaufs festgelegt wird, 
« eine Arbeitsphase sowie 
« eine Reflexion. 
Während einer Iteration darf ihr Ziel nicht 
mehr geändert werden, damit das Team fo- Reflektieren *t— 
kussiert arbeiten kann. Vorteile dieser Vorgehensweise sind früh sicht- und testbare Zwischener- 
gebnisse. Verankert sind auch klare Kommunikationsstrukturen und eine Visualisierung der 
Planung und des Arbeitsstands an einer Pinnwand. Bei dieser sogenannten >agilen Vorgehens- 
weise müssen Sie folgendes beachten: 


IH 
Stand-up-Meeting 


1) Grobplanung 

Notieren Sie jede Anforderung an das Produkt als soge- 
nannte User-Story mit einem Titel und einer knappen 
Beschreibung aus Nutzersicht. Achten Sie auf kleine 
Aufgabenpakete! 

Entscheiden Sie über die Wichtigkeit der User-Story auf 
einer Skala von 1 bis 50 (Priorisierung): Je kleiner die 
Zahl, desto wichtiger und desto früher wird die Anfor- 
derung umgesetzt. Lücken in den Prioritäten verdeutli- 
chen die unterschiedliche Wichtigkeit. 

Ein Project-Board mit den Spalten „ZU TUN“, „IN ARBEIT” 
und „FERTIG“ gibt einen Überblick über die Ziele und E +0 
den aktuellen Bearbeitungsstand. Bereiten Sie das Pro- 
ject-Board vor, indem Sie die User-Storys in der Reihen- 
folge der Priorisierung (wichtigste oben) in der Spalte 
„ZU TUN“ anheften. 


Vigenere-Verschlüsselung 
Man kann über eine Methode 
einen zu verschlüsselnden Text und 
einen Code eingeben und erhält als 
Rückgabe den verschlüsselten Text. 

1 


GUI-Gestaltung 
Benutzeroberfläche mit Eingabe-/ 
Ausgabefeldern und Buttons zum 
Ver-/Entschlüsseln erstellen. 


GUI-Funktionalität 


Funktionalität der Buttons umsetzen. 
41 


2) Organisatorische Festlegungen (gibt ggf. die Lehrkraft vor) 
Iterationsdauer: typischerweise 1-2 Doppelstunden; 

Besprechungen: typischerweise Iterationsplanung, 

Stand-up-Meeting (Kurzbesprechungen von maximal 

5 min im Stehen), Reflexionsmeeting (Retrospektive); 

Vorgaben zur Umsetzung (z. B. Entwicklungsumge- 

bung) und zum Endprodukt; 

Qualitätsabnahme (Review): Vorstellen der Zwischen- 

ergebnisse, typischerweise alle 1-2 Iterationen; 


Zeitrahmen, nach dem ggf. die Rollen beim Pair-Programming (s. u.) gewechselt werden 


3) Durchführung einer Iteration 
Iterationsplanung: Die Gruppe wählt entsprechend der Priorisierung User-Storys für die 
Iteration aus. 

Die Umsetzung von Aufgaben erfolgt zu zweit (Pair Programming). Jedes Paar nimmt eine 
User-Story, ergänzt auf der Karte die eigenen Namen als Verantwortliche und hängt sie in die 
Spalte „IN ARBEIT”. Entsprechend den Rollen Driver/Navigator wird die User-Story umge- 
setzt. Die Rollen werden regelmäßig gewechselt. 

Gibt es eine Schwierigkeit, die mehrere Paare betrifft (z. B. 
Methodennamen in unterschiedlichen Klassen passen 
nicht zusammen), darf spontan ein Stand-up-Meeting ein- 
berufen werden. 

Vor dem Umhängen der User-Story in die Spalte „FERTIG“ 
wird getestet! 

Die einzelnen Ergebnisse werden in ein Gesamtprojekt 
integriert. 


Der Driver ... 

- verwendet Tastatur und Maus 
und verfasst den Quelltext. 

+ „denkt laut“, d.h. teilt seine 
Absichten dem Navigator mit. 


Der Navigator ... 

+ stellt regelmäßig Fragen. 

- achtet auf Lesbarkeit des 
Quelltextes, z.B. durch aussa- 


P 5 a a gekräftige Variablennamen. 
Am Ende der Iteration wird der Arbeitsprozess reflektiert: ist verantwortlich'für.die 


Was hat gut funktioniert? Wo gab es Schwierigkeiten? Fokussierung auf die aktuelle 
Was wollen wir im nächsten Schritt verbessern/lernen? User-Story. 


Agile Werte - Einführung agiler Methoden 

Agiles Arbeiten ist verbunden mit Werten wie Selbstverantwortung, Feedbackkultur, Fokussie- 
rung und Transparenz. Das ist anspruchsvoll, weil teilweise Denkweisen und Verhaltensmuster 
geändert werden müssen. Deshalb führen Firmen regelmäßig Workshops durch, um Arbeitspro- 
zesse zu reflektieren und zu optimieren. Vielleicht helfen in diesem Sinne folgende Aufgaben als 
Warm-up für das Projekt. 


Aufgaben 


1 Retrospektive zum Projekt der Jahrgangsstufe 10 

Rückblicke zu Arbeitsprozessen helfen, Teamarbeit erfolgreicher zu machen. 

a Erstellen Sie in Einzelarbeit eine Mindmap zur Projektarbeit im Informatikunterricht des 
letzten Schuljahres. Sinnvolle Schlüsselbegriffe sind eingesetzte Arbeitsmethoden, Er- 
folgsfaktoren, Hindernisse, (meine) Wünsche. Ergänzen Sie mindestens 10 Begriffe. 

b Vergleichen und diskutieren Sie in Ihrem Team die Mindmaps aus a). Formulieren Sie als 
Ergebnis drei konkrete Ziele für Ihren Arbeitsprozess im Projekt. 


2 Agile Methoden 
a Recherchieren Sie ein kurzes Video, das die agile Vorgehensweise vorstellt, und notieren 
Sie als Zusammenfassung genannte Methoden, Begriffe, .... 
b Entscheiden Sie im Team, welche neuen Aspekte aus a) Sie im Vergleich zum letzten 
Schuljahr dieses Jahr in Ihren Arbeitsprozess aufnehmen wollen. 


Die Vorschläge in Kapitel 5.1 bis 5.4 sind so ausgelegt, dass verschiedene Gruppen nicht not- 
wendigerweise alle am gleichen Thema arbeiten müssen, sondern ihre Ergebnisse am Schluss 
wechselseitig vorstellen können. So erhält die ganze Klasse einen guten Überblick über die Ver- 
tiefungen in verschiedenen Themenbereichen. Achten Sie gruppenintern auf eine gute Aufga- 
benverteilung, um in der vorgegebenen Zeit ein ansprechendes Ergebnis zu erzielen. 
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5.1 Projektvorschläge: Graphen 


5 Vertiefung: Projekte 
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3 Navigationssysteme 
Bei Navigationssystemen ist die Größe der zu bearbeitenden Graphen so immens (Deutsch- 
landkarte: ca. 10.000.000 Knoten), dass der Dijkstra-Algorithmus zu lange für die Berechnung 
der kürzesten Route braucht. 


5.1 Projektvorschläge: Graphen 


1 Fahrplanauskunft 


Eine Fahrplanauskunft wird von vielen Apps und Webseiten für Bahnen, Busse usw. angeboten. 
Grundlage für Ermittlung der günstigsten Verbindung ist auch hier der Dijkstra-Algorithmus. 
Bei dieser Aufgabenstellung muss der Dijkstra-Algorithmus allerdings dahingehend modifi- 
ziert werden, dass bei einer Kante nicht direkt das Gewicht abgelesen wird, sondern dass es 
fürjede Kante eine Reihe von Fahrten gibt, von denen die günstigste (Abfahrt nach der Ankunft 
am aktuellen Knoten und zugleich frühestmögliche Ankunft am nächsten Knoten) gewählt 
werden muss. 

Die wesentlichen Aufgaben für das Projekt-Team sind: 

« Festlegen der benötigten Datenstrukturen zur Speicherung der Fahrplaninformation, 
Erstellen von Beispieldaten und Speichern (z. B. in einer Datenbank), 

Erstellen und Implementieren des modifizierten Dijkstra-Algorithmus und 

Entwerfen und Implementieren einer geeigneten Bedienoberfläche (z. B. textuell oder auf 
der Basis von Graphics and Games) zur Eingabe der Anfragedaten und zur Ausgabe der 
gefundenen Verbindung. 

Erweiterungen: Festlegung von Mindestumsteigezeiten, Auswahl möglicher Verkehrsmit- 
tel usw. 

Wesentlicher Stoffinhalt ist die Implementierung des Dijkstra-Algorithmus. 


Ganz nah am Kunden: den optimalen Standort wählen 

Ein großer Konzern möchte für seine Mitarbeiterinnen und Mitarbeiter im Kundendienst mög- 
lichst optimale Standorte innerhalb ihres Zuständigkeitsgebiets finden. Da die Aufträge - spe- 
ziellbei Reparaturen -zeitlich kaum vorausplanbar sind und möglichst schnell erledigt werden 
müssen, ist das Zusammenlegen von Aufträgen zu günstigen Gesamtfahrstrecken kaum mög- 
lich. Ein wichtiges Kriterium für den Standort ist daher, dass die Summe der Entfernungen zu 
allen Kunden möglichst klein ist. 

Zur Lösung dieser Aufgabe ist der Floyd-Warshall-Algorithmus besonders gut geeignet. Er ist 
in der Lage, alle Entfernungen von je zwei Orten in einem Graphen effizienter zu berechnen, 
als es mit wiederholter Anwendung des Dijkstra-Algorithmus möglich ist. 

Die wesentlichen Aufgaben für das Projekt-Team sind: 

Recherchieren und Analysieren Sie den Floyd-Warshall-Algorithmus. 

« Erläutern Sie, dass der Floyd-Warshall-Algorithmus besser geeignet ist als wiederholter 
Dijkstra-Algorithmus. (Tipp: Schätzen Sie den Aufwand durch Analyse der geschachtelten 
Wiederholungen ab.) 

Implementieren Sie den Floyd-Warshall-Algorithmus. 

Entwerfen und Implementieren Sie den Algorithmus zum Finden des optimalen Standorts 
auf Basis der Ergebnisse des Floyd-Warshall-Algorithmus. 

Entwerfen und Implementieren Sie eine einfache textuelle Bedienoberfläche zur Angabe 
des Datensatzes und zur Ausgabe des Ergebnisses. 

Erweiterung: Ergänzung einer geeigneten graphischen Bedienoberfläche 

Wesentlicher Stoffinhalt ist die Implementierung des Floyd-Warshall-Algorithmus. 


Um diese Problematik zu lösen, werden in der Regel zwei Ansätze parallel verwendet: 

« Der A*-Algorithmus ergänzt den Dijkstra-Algorithmus um Zusatzinformation (konkret: die 
geographische Lage der Knoten), die heuristisch ausgewertet wird, d. h., man geht davon 
aus, dass Knoten in geographischer Richtung des Ziels in der Regel besser sind, und be- 
zieht diese Annahme in die Gewichtung eines Wegs mit ein. 

» Hierarchische Karten lassen bei großen Entfernungen Details (und damit jede Menge 
Knoten) weg, nur im Start- und Zielbereich werden die genauesten Karten benötigt. 

Die wesentlichen Aufgaben für das Projekt-Team sind: 

« Recherchieren und Erkunden des A*-Algorithmus, 

« Implementieren des A*-Algorithmus, 

« Erstellen eines geeigneten Datensatzes für die Tests der Implementierung und 

« Entwerfen und Implementieren einer geeigneten Bedienoberfläche (z. B. textuell oder auf 
der Basis von Graphics and Games) zur Eingabe der Anfragedaten und zur Ausgabe der 
gefundenen Verbindung. 

Erweiterungen: Recherchieren und Erkunden der Anwendung hierarchischer Karten, Ergän- 

zung der Vorgehensweise um diesen Ansatz 

Wesentlicher Stoffinhalt ist die Erkundung und Implementierung des A*-Algorithmus. 


Zeitbedarf der Algorithmen 

Ziel dieses Projekts ist die experimentelle Bestimmung des Zeitverhaltens der behandelten 

Algorithmen (Laufzeitmessung) in Abhängigkeit von der Knotenanzahl. Breitensuche und 

Dijkstra-Algorithmus sollen auf jeden Fall untersucht werden; der Floyd-Warshall-Algorithmus 

kann untersucht werden, insbesondere, wenn auch Projektvorschlag 2 umgesetzt wird. 

Die wesentlichen Aufgaben für das Projekt-Team sind: 

» Festlegen der minimalen Knotenanzahl und testen, wie oft diese Minimalaufgabe durch- 
laufen werden muss, um gut messbare Zeiten zu erhalten, 

« Erstellen einer Testdatenfolge für jeden zu testenden Algorithmus, bei der die Knotenan- 

zahl N sich immer verdoppelt (N, 2N, 4N, 8N, 16N), 

Darstellen der Ergebnisse in graphischer Form (z. B. in einem Tabellenkalkulationspro- 

gramm), Formulieren einer Vermutung über den Zusammenhang zwischen Laufzeit und 

Knotenanzahl und Überprüfen dieser Vermutung anhand der Daten. 

Erweiterung: Begründen des vermuteten Zusammenhanggs zwischen Laufzeit und Knotenan- 

zahl aus der Struktur der jeweiligen Algorithmen (geschachtelte Wiederholungen) 

Wesentlicher Stoffinhalt ist die Auseinandersetzung mit dem Laufzeitbedarf. 
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5 Vertiefung: Projekte 


5.3 Projektvorschläge: Netze 
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5.2 Projektvorschläge: Codierung 5.3 Projektvorschläge: Netze 


1 Vigen£ere-Verschlüsselung 1 Messung des real verfügbaren Datendurchsatzes in einem Netz 
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Implementieren Sie die Vigen&re-Verschlüsselung (s. Kapitel 2.3). 
Die wesentlichen Aufgaben für das Projekt-Team sind die Erstellung geeigneter Methoden: 
» zum Verschlüsseln und 
+ zum Entschlüsseln. 
Erweiterungen: 
« Implementieren des Kasiski-Verfahrens zum Knacken einer Vigenere-Verschlüsselung, 
(s. auch Aufgabe 3c) von Kapitel 2.3) 
« Integrieren des Programms in ein Programm zur asymmetrischen Verschlüsselung 
(vgl. Projektvorschlag 2): Es soll ein symmetrischer Schlüssel verwendet werden, der vor- 
her unter Verwendung eines asymmetrischen Verfahrens verschlüsselt übermittelt wurde. 
Wesentlicher Stoffinhalt ist die Implementierung des Vigenere-Verschlüsselungsalgorithmus. 


RSA-Algorithmus 

Der RSA-Algorithmus ist der wohl bekannteste asymmetrische Verschlüsselungsalgorithmus. 

Der Ablauf von Schlüsselerstellung, Ver- und Entschlüsselung ist bereits in Aufgabe 8 von 

Kapitel 2.4 genau beschrieben. 

Die wesentlichen Aufgaben für das Projekt-Team sind: 

« Recherche und Einarbeitung in eine Programmbibliothek, die den Umgang mit unbe- 

grenzt langen ganzen Zahlen ermöglicht, 

Ermittlung genügend großer Primzahlen (z. B. auf Basis einer angegebenen 

Mindeststellenzahl), 

Erstellung der Schlüssel, 

effiziente Codierung des gegebenen Klartexts als Zahl, die dann verschlüsselt werden 

kann (und Umkehrung), 

« Bestimmung des multiplikativen Inversen durch Umsetzung des erweiterten Euklidischen 
Algorithmus, 

« Ver- und Entschlüsselung der Nachricht. 

Erweiterungen: 

« Ergänzen von Methoden zum Signieren von Nachrichten, 

« Integrieren des RSA-Programms in ein Programm zur symmetrischen Verschlüsselung (vgl. 
Projektvorschlag 1): Nach der symmetrischen Verschlüsselung einer Nachricht soll nur der 
Schlüssel mit RSA verschlüsselt werden. 

Wesentlicher Stoffinhalt ist die Implementierung des RSA-Algorithmus. 


AES - Ein modernes symmetrisches Verschlüsselungsverfahren 

Der Advanced Encryption Standard (AES) ist ein symmetrisches Verschlüsselungsverfahren, 
das unter anderem in WLAN-Netzen zum Einsatz kommt. Im Unterschied zu Cäsar oder Vi- 
gen£re werden bei AES nicht einzelne Buchstaben verschlüsselt, sondern Blöcke von Bits. Die 
Größe eines Blocks stimmt mit der Schlüssellänge überein und beträgt 128, 192 oder 256 Bit. 
Einen genügend langen Schlüssel vorausgesetzt, genügt AES sogar den Ansprüchen des ame- 
rikanischen Geheimdienstes. Informieren Sie sich über die Funktionsweise von AES und prä- 
sentieren Sie die Ergebnisse in der Klasse. 


In den technischen Standards für Komponenten der Netzzugangsschicht werden oft 

„bis zu“-Geschwindigkeiten definiert. Die Verbindung zweier Rechner über ein Kupferkabel 

nach 1000BASE-T Standard ermöglicht beispielsweise theoretisch eine Übertragungsrate von 

bis zu 1000 Megabit/s. In der Realität ist die tatsächlich erreichbare Übertragungsrate für 

Nutzdaten jedoch meist um einiges geringer, z. B. weil ein Teil der Übertragungskapazität für 

Protokollsteuerdaten benötigt wird und es aufgrund einer hohen Netzauslastung zu Verzöge- 

rungen kommen kann. 

Im Rahmen dieses Projektes soll ein Programm entwickelt werden, mit dem die tatsächlich 

erreichbare Übertragungsrate zwischen zwei Rechnern in einem lokalen Netz durch eigene 

Messungen ermittelt werden kann. Dabei solleine definierte Datenmenge zwischen denRech- 

nern ausgetauscht und die dafür benötigte Übertragungszeit gemessen werden. Hierfür wird 

je ein einfaches Client- und Serverprogramm benötigt. Im einfachsten Fall verbindet sich der 

Client mit dem Server und sendet eine definierte Menge an Testdaten, welche der Server un- 

mittelbar nach Erhalt an den Client zurücksendet. Auf Seiten des Clients wird derweil die Zeit 

bis zum vollständigen Eintreffen der gespiegelten Daten gemessen. 

Je nach Größe und Arbeitstempo des Teams kann das Programm über diese Grundfunktiona- 

lität hinaus noch vielfältig erweitert werden, z. B.: 

» Messung mit verschiedenen Protokollen (z.B. TCP vs. UDP), 

» Messung in vorgegebenen zeitlichen Abständen und automatische Berechnung von 
Durchschnittswerten und 

« grafische Visualisierung der Messergebnisse. 

Nachdem das Programm einsatzbereit ist, kann als Abschluss eine Testreihe durchgeführt wer- 

den, gefolgt von einer Auswertung und Interpretation der aufgezeichneten Messergebnisse. 


Aufbau eines lokalen Rechnernetzes in der Praxis 
Ziel dieses Projektes ist es, den Aufbau eines Rech- 
nernetzes und die Konfiguration der daran betei- 
ligten Komponenten in der Praxis nachzuvollzie- 
hen. Hierfür stellt Ihnen Ihre Informatiklehrkraft 
entsprechende Geräte und Verbindungskabel zur 
Verfügung. Ihre Aufgabe ists, die beteiligten Kom- 
ponenten zunächst sinnvoll zu einem Netz zu ver- 
binden und durch eine geeignete Konfiguration 
dafür zu sorgen, dass ein Datenaustausch über das 
Netz möglich wird. 

Je nach vorhandener Hardware und Komplexität 
des Netzes können dabei verschiedene Schritte 
notwendig sein z.B.: 

» Verbinden der Endgeräte über Switches, Medienkonverter, Kabel, etc., 
Zuweisung passender IP-Adressen an alle Geräte im Netz, 

Konfiguration eines Routers und Anlegen passender Routingtabellen, 

» Herstellen einer Verbindung zum Schulnetz/zum Internet, 

Einrichtung eines DHCP-Servers zur automatischen IP-Adressvergabe und 
« Erweiterung des Netzes um ein Funknetz (WLAN). 


Switches mit Netzwerkkabel-Verbindungen 
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Implementieren Sie eine Chat-Anwendung nach dem Client/Server-Prinzip. Diese soll es meh- 
reren Teilnehmern in einem lokalen Netz ermöglichen, Textnachrichten miteinander auszu- 
tauschen. Das Client-Programm baut hierfür zunächst eine Verbindung mit dem Server-Pro- 
gramm auf. Sendet ein Client nun eine Nachricht an den Server, leitet dieser die Nachricht an 
alle verbundenen Clients weiter. Die Clients zeigen die eingehenden Nachrichten dann nach- 
einander als Gesprächsverlauf an. Für die Projektarbeit bietet es sich an, je ein Team für die 
Entwicklung des Server- und des Client-Programms zu bilden. Damit die Programme später 
reibungslos zusammenarbeiten, sollte zu Beginn gemeinsam ein Chatprotokoll spezifiziert 
werden, in dem das Format und die Übertragung der Chatnachrichten genau festgelegt wer- 
den. 


Ein Kommunikationsprotokoll für den Medienzugriff selbst entwickeln 

Um verschiedenen Geräten mit möglichst wenig elektroni- 

schem Aufwand die Kommunikation untereinander zu er- 

möglichen, kann ein RS-485 Bus genutzt werden. Der Begriff 

„Bus“ bedeutet dabei, dass alle Teilnehmer an das gleiche 

Paar Kupferadern angeschlossen sind, weshalb sicherge- 

stellt werden muss, dass stets nur ein Gerät gleichzeitig sen- 

det. Der Standard RS-485 beschreibt den elektrischen Auf- 

bau der Kommunikationsschnittstelle, macht aber keine Angaben darüber, wie der 
Medienzugriff unter den Bus-Teilnehmern geregelt wird. Dies muss folglich im Rahmen eines 
Protokolls festgelegt werden. Für dieses Projekt wird davon ausgegangen, dass entsprechen- 
de Hardware zur Verbindung mehrerer Rechner (oder programmierbarer Mikrocontroller) 
mittels RS-485 bereits zur Verfügung steht. Ziel der Projektarbeit ist es, ein entsprechendes 
Kommunikationsprotokoll zu entwerfen, zu implementieren und zu testen, welches die Kom- 
munikation zwischen mehreren Busteilnehmern ermöglicht. Denkbar ist dabei sowohl eine 
Kollisionsvermeidung (das Protokoll stellt sicher, dass stets nur ein Busteilnehmer gleichzeitig 
sendet) oder eineKollisionserkennung (Datenkollisionen durch gleichzeitig sendendeTeilneh- 
mer werden in Kauf genommen; das Protokoll legt fest, wie eine fehlerhafte Übertragung er- 
kannt und darauf reagiert werden kann). 


Physical Computing: Vernetzte Sensoren 

Für dieses Projekt stellt Ihnen Ihre Lehrkraft einen Satz kleiner programmierbarer Mikrocon- 
troller mit eingebauter WLAN-Funktionalität sowie verschiedene Sensoren (z. B. Temperatur, 
Luftfeuchtigkeit usw.) zur Verfügung. Arbeiten Sie sich zunächst in die Programmierung 
dieser Mikrocontroller ein und erstellen Sie anschließend im Team ein Netz aus Sensorknoten, 
die ihre Messwerte per WLAN-Verbindung an einen Master-Controller senden, welcher die 
gesammelten Daten auf geeignete Weise ausgibt. Als Erweiterung des Projektumfangs ist 
auch denkbar, dass die gesammelten Messwerte automatisch im Internet veröffentlicht wer- 
den oder in Abhängigkeit von den Messwerten passende Aktionen ausgelöst werden. 


Rechnernetze simulieren - Teil 3 

Erweitern Sie ausgehend von den Aufgaben 9 und 6 in den Kapiteln 3.1 bzw. 3.3 eine 
Netzwerksimulation um Komponenten wie einen E-Mail- und Chatserver. 

Testen Sie nach jeder Erweiterung die Funktionsfähigkeit. 


1 Social Bots 


Mit weltweit über mehreren Milliarden täglich aktiven Nutzern haben soziale Netzwerke eine 
riesige Reichweite und dementsprechende Bedeutung in unserer digitalisierten Gesellschaft. 
Die Möglichkeit, in einer technischen Umgebung so viele Menschen zu erreichen, stellt aber 
auch einen großen Anreiz für Manipulationen dar. Eine solche Manipulation ist möglich mit 
Social Bots- Computerprogrammen, die über eine Programmierschnittstelle in sozialen Netz- 
werken kommunizieren. 

Recherchieren Sie, welche Manipulationsziele mit Social Bots verfolgt werden und über 
welche „Aktivitäten“ Bots versuchen, diese Ziele zu erreichen. Fassen Sie das Ergebnis 
knapp zusammen. 


Schnittstellen für Server-Anwendungen 
Aus technischer Sicht besteht ein soziales Netzwerk aus einem Datenbanksystem und einer 
speziellen Server-Anwendung („Backend‘). Erkunden Sie in dieser Aufgabe unterschiedliche 
Zugriffsmöglichkeiten auf die Daten des sozialen Netzwerks SocialBotNet. 
Nutzersicht: Der typische Zugriff auf ein soziales Netzwerk für Menschen erfolgt per App oder 
Browser („Frontend‘“). 
a Melden Sie sich bei SocialBotNet mit einem Pseudonamen an. Erstellen Sie mindestens 
zwei Posts und ergänzen Sie Ihr Profil um mindestens zwei (ausgedachte) Angaben. 
b Lassen Sie sich alle Posts anzeigen und beschreiben Sie, welche Sortiermöglichkeiten 
Sie haben. 
c Interagieren Sie durch Likes bzw. direkte Antworten mit anderen Beiträgen. 


© Top 3 Trends 


a. 


Eine neue Studie zeigt, es gibt keine Social Bots! 
— Apr 5, 2022 10:22:45 AM 


Gefällt: Fritz29 , Fritz30 ,Fritz31 und 28 weiteren. 


Daten(bank)sicht („Backend“): 
d Notieren Sie (beispielsweise in einem Objektdiagramm), welche Informationen von jedem 
Nutzer bzw. jedem Post gespeichert sind. 
*e Formulieren Sie eine Datenbankabfrage, die all Ihre Posts sortiert nach Datum auflistet. 
Die entsprechende Tabelle hat den Namen „Posts“. 
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„Bot-Sicht”: Nicht nur Menschen, _|httpsi/Awww.socialbotnet.de 
auch Computerprogramme können LE Bun 
aufsoziale Netzwerke zugreifen, wenn S 

Fi A Hallo, Welt! 
es eine entsprechende Kommunika- — Mar 17, 2019 7:54:48 PM 
tionsschnittstelle für Programme gibt 


(API: engl. Application Programming 


Gefällt: Hello , Wetterfuehlig , HiHiHi und 2 weiteren. 


Social Bots - Arbeitsweise verstehen und selbst programmieren 


4 Bot-Programmierung Teil 1: Posten und Liken 


In der Vorlage finden Sie einen einfachen Bot, der Informationen aus dem Netzwerk lesen 
(GET-Anfrage) und Einträge im Netzwerk ergänzen bzw. verändern kann (POST-Anfrage). Zur 
Vereinfachung des Zugriffs auf das soziale Netzwerk über http(s) wird eine Klasse 


https://www.socialbotnet.de/api/posts - x | 
Interface). Im SocialBotNet lässt sich JSON Rohdaten Kopfzeilen 
diese Schnittstelle einfach über pas- | 2 n.,üf 
. : "Hallo, Welt!” 
sende Webadressen (URLs) einsehen. N rg 
f Lassen Sie sich über id: 1 
www.socialbotnet.de/api/posts ee Bi 
b hobbies: "Netzwerken" 
zw: about: "Ich bin root” 


www.socialbotnet.de/api/users publishingDate: "2019-03-17 19:54:48” 


alle Posts und User anzeigen und “likedBy: 

vergleichen Sie die Daten mit der ar ” ö 

Anzeige für menschliche Nutzer Mae Malice 
(Teilaufgabe b). hobbies: "Grüßen" 

Nennen Sie die Informationen, die ErR. ade En a nn 
nur bei der API angezeigt werden. i 1; 2 

Ergänzen Sie entsprechend Attri- | username: _"NOname123" 


bute bei Ihrem Ergebnis von d). 

qg Rufen Sie https://www.socialbotnet.de/api/posts?sortby=likes auf. Versuchen Sie auch die 
anderen Sortierreihenfolgen der Nutzersicht (Teilaufgabe b) über die direkte Eingabe 
einer URL zu erhalten. Notieren Sie als Ergebnis die entsprechende URL oder Ihre Ver- 
mutung, warum die Sortierung über die API nicht möglich ist. 


Netzwerkkommunikation über http(s) 

Viele moderne Webbrowser enthalten sogenannte Entwicklerwerkzeuge, mittels derer das 

Abrufen und der Aufbau von Webseiten im Detail analysiert werden kann (vgl. Einstiegsauf- 

gabe Kapitel 3.4). 

a Vergleichen Sie eine solche Netzwerkanalyse beim Aufruf der Webseiten in der Nutzer- 
sicht (www.socialbotnet.de) bzw. Bot-Sicht (www.socialbotnet.de/api/posts) 

Stellen Sie dazu gegenüber, welche Dateien als Antwort vom Server übertragen werden. 

b Begründen Sie, dass bei beiden Anfragen das Protokoll http(s) verwendet wird. 

c http bietet dem Client GET- und POST-Anfragen. Beschreiben Sie knapp den Unterschied. 
Recherchieren Sie gegebenenfalls. GET-Anfragen haben Sie bereits in a) durchgeführt, 
eine POST-Anfrage erfolgt beim Anmelden. 

d Unter Materialien gibt es auf der Webseite SocialBotnet eine Übersicht zu den möglichen 
GET- und POST-Anfragen. Verschaffen Sie sich einen Überblick und begründen Sie, warum 
POST-Anfragen bei einer Eingabe in die Adresszeile des Browsers nicht funktionieren. 


NETZWERKZUGRIFF mit folgenden 
Methodenverwendet.BeiVeröffent- 
lichungen müssen zunächst über 
POSTAnfrageVorbereiten verschie- 
dene Bestandteile wie die Zugangs- 
daten gesammelt werden, bevor 


NETZWERKZUGRIFF 


Er 
NetzwerkZugriff(fdomain: ZEICHENKETTE) 


GETAnfrageSenden(url: ZEICHENKETTE) -> ZEICHENKETTE 
POSTAnfrageVorbereiten(parameterName: ZEICHENKETTE, 
parameterWert: ZEICHENKETTE) 


dann die POST-Anfrage gesendet 
wird. 


POSTAnfrageSenden(url: ZEICHENKETTE) 


GET-Anfragen: 

a Analysieren Sie die Methode postsAusgeben und rufen Sie diese auf. Notieren Sie aus der 
Antwort eine ID einer eigenen Veröffentlichung. 

b Analysieren Sie die Methode postsFormatiertAusgeben und rufen Sie diese auf. Beschrei- 
ben Sie die Ausgabe im Vergleich zu a). 

c Implementieren Sie die Methoden userAusgeben und userFormatiertAusgeben. 

POST-Anfragen: 

d Posten Sie eine Nachricht über einen Aufruf der Methode posten. Überprüfen Sie in der 
Nutzersicht Ihres Browsers, ob der Post im Netzwerk angekommen ist. 

e Liken Sie über einen passenden Methodenaufruf den Post aus Teilaufgabe a). Sollte dieser 
schon ein Like haben, dann unliken sie zuerst über die Nutzersicht. 

f Erklären Sie sich zu zweit gegenseitig Zeile für Zeile die Methode eigenePinnwandliken. 
Testen Sie die Methode. 

g Schreiben Sie eine Methode eigenePinnwandUnliken. 

h Bots verfolgen in der Regel konkrete Ziele, beispielsweise das Posten vieler Nachrichten 
zu einem Thema. Welches Ziel verfolgt Ihr Bot? Implementieren Sie eine passende 
Methode. 


Bot-Programmierung Teil 2: Menschliches Verhalten 

Damit ein Bot nicht sofort als solcher erkannt wird, muss er ein wenig menschlich wirken. Dies 

ist möglich, in dem seine Posts variieren und er auf Schlüsselwörter in Posts oder Profileinstel- 

lungen anderer User reagiert. 

a Recherchieren Sie für Ihre Programmiersprache Methoden ... 

» „zur Prüfung, ob in einer Zeichenkette ein Schlüsselwort enthalten ist. 
« „. zum Ersetzen von Wörtern in einer Zeichenkette. 

b Analysieren Sie die Vorlage. Beschreiben Sie knapp die Strategien, die verwendet werden, 
um den Bot menschlich wirken zu lassen. 

c Erweitern bzw. ändern Sie das Verhalten des Bots. Testen Sie den Bot unter SocialBotNet. 
Hinweis: Es ist hilfreich, wenn Sie sich zu dritt oder zu viert auf eine Thematik wie Filme 
einigen. Wenn mehrere Bots auf die gleiche Thematik reagieren, ist eine Interaktion sicht- 
bar. 


Forschungsauftrag Bot-Programmierung Teil 3: Aktuelle Ereignisse 

Recherchieren Sie einen Onlinedienst, bei dem man über eine API aktuelle Daten, z. B. Wetter- 
daten, abrufen kann. Implementieren Sie einen Bot (für SocialBotNet), der Daten abruft und 
passend dazu postet. 
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5 Vertiefung: Projekte 


5.4 Projektvorschläge: Künstliche Intelligenz 


1 Wissensbasierter Ansatz - logische Programmierung mit PROLOG 


(Projektmöglichkeiten für die ganze Klasse) 
Für das logische Schließen gibt es eigene 
Programmiersprachen. Sie basieren nicht 
auf Anweisungen (imperative Program- 
mierung) oder auf Klassen und Objekten 
mit Attributen und Methoden (objektori- 
entierte Programmierung), sondern auf 
Fakten und Regeln. Die am weitesten ver- 
breitete logische Programmiersprache 
PROLOG wurde explizit für Kl-Anwendun- 
gen geschaffen. Unter Nutzung von PRO- 
LOG lässt sich das Beispiel aus dem Lehrtext in Kapitel 4.2 wie rechts abgebildet formulieren: 
Nutzen sie zunächst die Teilaufgaben a), b) und c), um sich mit der grundlegenden Funktions- 
weise von PROLOG vertraut zu machen. 

a Öffnen Sie eine PROLOG-Programmierumgebung und geben Sie das obige Programm 
ein. Stellen Sie die Anfrage aus dem Lehrtext. Verwenden Sie dazu den folgenden Befehl: 
?- enkel(naomi, lisa). 

Stellen Sie zwei weitere Anfragen, die die oben vorkommenden Namen verwenden. 

b Passen Sie die Fakten so an, dass Sie Ihren eigenen Familienverhältnissen entsprechen. 
Ergänzen Sie die Fakten- und Regelbasis so, dass auch nach Vater, Mutter und Großeltern 
gefragt werden kann. 

c Recherchieren Sie wichtige Elemente der Sprache und fassen Sie diese in einer Übersicht 
zusammen. 

Nachdem Sie nun einen ersten Einblick in PROLOG erhalten haben, wenden Sie sich als Team 

einem eigenen Projekt zu. Recherchieren Sie ggf. die notwendigen Informationen bzw. schla- 

gen Sie die Dokumentation von PROLOG nach. 

Mögliche Projekte wären unter anderem: 

« Entwicklung eines Expertensystems, das Anfragen zu Symptomen bzw. Krankheiten und 

geeigneten Medikamenten zur Behandlung entgegennehmen kann, 

Entwicklung eines Expertensystems, das Anfragen zu Lebensmitteln und Nährstoffen ent- 

gegennehmen kann und 

Entwicklung eines Expertensystems, das Anfragen zu Städten, Ländern und Entfernungen 

zwischen diesen Städten entgegennehmen kann. 

Die wesentlichen Aufgaben für ein Projekt-Team sind: 

» Recherche zum Themenkomplex, 

« Umsetzung der Rechercheergebnisse in Fakten und Regeln und 

« Entwicklung gängiger Abfragen. 

Wesentlicher Stoffinhalt sind Expertensysteme als ein wissensbasierter Ansatz unter Nutzung 

der Programmiersprache PROLOG. 


%Fakten 

kind (naomi, stefan). 
kind (naomi, miriam). 
kind (stefan, lisa). 

kind (david, lisa). 


%Regeln 
enkel (X, Y): kind(X, K), kind(K, Y). 


Wie arbeiten Kl-Systeme? (Projektmöglichkeiten für die ganze Klasse) 

Kl wird häufig in Nachrichten und Berichten genannt, weil es zunehmend unseren Alltag un- 
terstützt bzw. beeinflusst. Die wenigsten Menschen haben aber eine Vorstellung davon, wie 
vielseitig KI-Systeme sind und wie einzelne Systeme arbeiten. Erstellen Sie eine Übersicht mit 
Erklärungen (z.B. als Plakat), um aufeinemTag der offenen Tür Eltern und jüngere Schülerinnen 
und Schüler zu informieren. Eigenaktivität unterstützt das Verständnis sehr stark. Erstellen Sie 
deshalb begleitend zu Ihrer Übersicht beispielsweise kleine Aufgaben, ein Rollenspiel, 


5.4 Projektvorschläge: Künstliche Intelligenz 


ein Quiz - etwas, das die Wissenssuchenden in eine aktive Rolle bringt. 

Mögliche Projekte wären unter anderem: 

Erklärung von überwachtem Lernen, 

» Erklärung von unüberwachtem Lernen, 

« Erklärung von verstärkendem Lernen, 

« Gegenüberstellung wissensbasierter und datenbasierte Ansätze für KI, 

» Demonstration einer Gesichtserkennungssoftware, 

interaktive Kunstinstallation, die Webcambilder in Echtzeit mit künstlerischen Filtern 

anreichert, 

« Erläuterung der Funktionsweise von neuronalen Netzen und 

« Diskussion gesellschaftlich relevanter Fragestellungen an konkreten Kl-Anwendungen. 

Die wesentlichen Aufgaben für ein Projekt-Team sind: 

« Auswahl eines Subthemas im Rahmen des Tags der offenen Tür, 

« Erstellen einer allgemeinverständlichen Erklärung und Darstellung der Ergebnisse (z.B. als 
Plakat) und 

« Auswahl, Adaption oder Entwicklung einer Aktivität, die die Wissenssuchenden dazu 
bringt, sich mit dem Lerngegenstand auseinanderzusetzen. 

Wesentlicher Stoffinhalt ist die Auseinandersetzung mit den Inhalten des Themenbereichs Kl 

und die Einnahme einer vermittelnden Perspektive. 


Überwachtes Lernen umsetzen (Projektmöglichkeiten für die ganze Klasse) 

In Kapitel 4.3 hat Ihre Lehrkraft einen konkreten Algorithmus (Alternative 1 oder Alternative 2) 

für die Umsetzung von überwachtem Lernen ausgewählt. Dieses Projekt thematisiert den an- 

deren, in Kapitel 4.3 dargestellten Algorithmus. 

Die wesentlichen Aufgaben für das Projekt-Team sind: 

» Analysieren der Beschreibung des zweiten Algorithmus in Kapitel 4.3, 

« Recherchieren nach weiteren Beschreibungen / Beispielen für den Algorithmus, 

« Implementieren des Algorithmus und 

« Einsetzen des Algorithmus an mindestens zwei konkreten Beispielen unter genauer Be- 
achtung der Umsetzungsstrategien aus Kapitel 4.4. 

Erweiterung: Vergleichen der Funktionsweise der beiden Algorithmen und plausibel darstel- 

len, wo Gemeinsamkeiten und Unterschiede der beiden Ansätze liegen. 


Wesentlicher Stoffinhalt ist die Auseinandersetzung mit dem im Unterricht nicht behandelten 
Kl-Algorithmus aus Kapitel 4.3. 


Überwachtes Lernen in eigenen Apps (Projektmöglichkeiten für die ganze Klasse) 
Anwendungen des maschinellen Lernens werden oft nicht für sich entwickelt, sondern stehen 
in einem größeren Kontext, wobei verschiedene Algorithmen und Verfahren kombiniert wer- 
den, um den Nutzenden einen echten Mehrwert zu bieten. Das Erkennen von Gesichtsmerk- 
malen für die Anwendung von Filtern etwa lässt sich grob in drei Schritte einteilen. Zunächst 
wird das Gesicht verortet. Dabei wird beispielsweise mithilfe von Helligkeitsunterschieden 
festgestellt, wo im Bild ein Gesicht zu sehen ist. Anschließend wird das Gesicht normalisiert, 
d.h. das Bild wird so gedreht und zugeschnitten, dass nur das Gesicht zu sehen ist. Schließlich 
wird mithilfe von maschinellem Lernen die Position von Mund, Nase und Augen erkannt. Na- 
türlich muss nicht für jede Anwendung alle Arbeit erneut gemacht werden. Als Entwicklerin 
bzw. Entwickler kann man in solchen Fällen stattdessen auf existierende Programmbibliothe- 
ken, Softwarepakete oder Werkzeuge zurückgreifen, um entsprechende Funktionalität in die 
eigene Anwendung zu integrieren. Bilden Sie Gruppen und entscheiden Sie sich für eine eige- 
ne kleine Anwendung, die ein KlI-Modell benutzt. Mögliche Projekte wären unter anderem: 
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« Entwicklung eines Fotofilters, der Personen eine virtuelle Clownsnase aufsetzt, 

« Entwicklung eines Sprachassistenten, der Befehle entgegennimmt und Aktionen ausführt 
(bspw. Fragen nach dem Wetter beantwortet), 

« Entwicklung eines interessensbasierten Empfehlungssystems und 

» Entwicklung eines magischen Buchs, das auf Handgesten reagiert. 

Im Download-Angebot finden Sie Vorschläge für Werkzeuge, die Sie nutzen können. 

Die wesentlichen Aufgaben für das Projekt-Team sind: 

« Auswählen bzw. Erstellen eines maschinellen Lernmodells, 

» Integrieren des Kl-Systems in nutzbare Anwendung (z.B. eine Website oder App) und 

« Durchführen einer Nutzerstudie und ggf. Verbesserung der eigenen Anwendung. 


Wesentlicher StoffinhaltistdielntegrationvonKl-SystemeningängigeSoftwareanwendungen. 


5 Daten auswählen (Projektmöglichkeiten für die ganze Klasse) 
Das Werkzeug Orange stellt verschiedene Datensätze zur Verfügung. Bilden Sie Gruppen und 
wählen Sie als Gruppe einen der Datensätze. Das Ziel des erstellen Modells hängt dabei vom 
gewählten Datensatz ab. 
Die wesentlichen Aufgaben für das Projekt-Team sind: 
Erstellen eines neuen Projekts und Laden des Datensatzes, 
Untersuchen der Rohdaten, 
Trainieren eines Entscheidungsbaummodells, 
Testen des Modells mit einigen Beispielen und systematisch mit extra zurückgehaltenen 
Testdaten unter Verwendung einer geeigneten Metrik, um die Güte Ihres Modells zu eru- 
ieren (siehe auch Kapitel 4.4), und 
Diskutieren möglicher Implikationen des Einsatzes Ihres Modells und, ob und unter wel- 
chen Bedingungen Ihr Modell in der Praxis eingesetzt werden sollte (z. B. wer von Ihrem 
Modell profitieren bzw. wer benachteiligt werden könnte). 


Wesentlicher Stoffinhalt ist der Prozess beim überwachten Lernen von der Datenaufbereitung, 
über die Erstellung des Modells bis hin zu dessen Evaluation. 


6 Viele Arten neuronaler Netze (Projektmöglichkeiten für die ganze Klasse) 
Sammeln Sie Informationen zu neuronalen Netzen, bereiten Sie diese in Präsentationen auf 
und stellen Sie die Ergebnisse in der Klasse vor. Anhaltspunkte können sein: 
« Typen neuronaler Netze und ihre Kategorisierung (rekurrente Netze, Kohonen-Netze, 
Hopfield-Netze, Convolutional Neural Networks ...), 
« Einsatzbereiche neuronaler Netze, 
« historische Entwicklung, Meilensteine und 
« die größten neuronalen Netze (Einsatzbereich, Energieverbrauch ...). 


Die wesentlichen Aufgaben für ein Projekt-Team sind: 
« Recherchieren relevanter Informationen für eigenes Thema und 
« Erstellen einer Präsentation. 
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Aufgaben in Kapitel 1 


T1 Richtig oder falsch? 


T2 


T3 


b 
c 
d 


nn 


richtig 

Falsch: Ein gerichteter Graph kann Kantengewichte haben. 

richtig 

Falsch: Es wird der Weg mit der kleinsten Anzahl an Kanten gefunden, der bei gewichteten 
Graphen nicht der kürzeste Weg sein muss. 

Falsch: Die Knoten werden in konzentrischen Bereichen um den Startknoten abgearbeitet. 
richtig 

Falsch: Er kann auch für ungewichtete Graphen verwendet werden und bringt dann das 
gleiche Ergebnis wie die Breitensuche. 


Eine gute Erklärung ist alles! 


Die Breitensuche sucht den Pfad mit der geringsten Anzahl an 
Knoten. Wenn der Graph gewichtet ist, kann es aber sein, dass 
der Weg über mehrere gering gewichtete Kanten kürzer ist als 
über eine einzige stark gewichtete Kante. So findet die Breiten- 
suche den direkten Weg von A nach C (eine Kante, Länge 6), während der kürzeste Weg 
über B führt (2 Kanten, Länge 5). 

Bei der Berechnung der Weglänge für neu gefundene Knoten muss das Gewicht der Kan- 
te vom aktuellen Knoten zum neuen Knoten addiert werden, bei der Breitensuche wird 
jeweils 1 dazu addiert. Außerdem muss für die Knoten in der To-Do-Liste geprüft wer- 
den, ob der so berechnete Weg kürzer ist als der Weg, auf dem der Knoten bisher erreicht 
wurde. 

Es wird derjenige Knoten in der To-Do-Liste gesucht, der die kürzeste Entfernung zum 
Startknoten hat. Nur so kann garantiert werden, dass immer mit dem kürzestmöglichen 
Weg weitergearbeitet wird. Bei der Breitensuche wurde einfach der erste Knoten aus der 
To-Do-Liste verwendet. 


Programmieren 


klasse GRAPHMATRIX 
geschützt attribut matrix: FELD<FELD<GANZZAHL>> 
geschützt attribut maxPersonenanzahl: GANZZAHL 


Umsetzungen für 
konkrete Sprachen 
finden sich in 


den Download- 


materialien. 
konstruktor () 


matrix = neu FELD<FELD<GANZZAHL>> () 

zähle indexl von 0 bis 5 
matrix.Hinzufügen (neu FELD<GANZZAHL> ()) 
zähle index2 von 0 bis 5 


matrix.ElementGeben (index1) .Hinzufügen (-1) 


(@] 
endezähle 
endezähle 
matrix.ElementGeben (0) .ElementSetzen (1, 2) 
endekonstruktor 
endeklasse 
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warteliste.Leeren() 
fertigeKnoten.Leeren() 
aktuellerKnoten = start 
aktuellerKnoten.LängeSetzen(0) 


wiederhole solange nicht aktuellerKnoten == zielKnoten 
zähle nummer von 0 bis anzahlKnoten - 1 
matrix.ElementGeben(aktuellerKnoten).ElementGeben(nummer) > 0) und 


(nicht fertigeKnoten.Enthält(nummer)) und 
(nicht warteliste.Enthält(nummer) 


knoten.LängeSetzen(aktuellerKnoten.LängeGeben() + 1) 
warteliste.Anfügen(knoten) 


aktuellerKnoten = warteliste.ElementGeben(0) 
warteliste.Entfernen(0) 
Ausgabe("Der Weg vom Start zum Ziel geht über ") 
Ausgabe(aktuellerKnoten.LängeGeben()) 
Ausgabe(" Kanten") 


warteliste.Leeren() 
fertigeKnoten.Leeren() 
aktuellerKnoten.LängeSetzen(0) 


wiederhole solange nicht aktuellerKnoten == zielKnoten 


zähle nummer von 0 bis anzahlKnoten - 1 
matrix.ElementGeben(aktuellerKnoten).ElementGeben(nummer) > 0) und 
(nicht fertigeKnoten.Enthält(nummer)) und 
(nicht warteliste.Enthält(nummer) 


aktuellerKnoten = warteliste.ElementGeben(0) 
warteliste.Entfernen(0) 
Ausgabe("Der Weg vom Start zum Ziel geht über") 
Ausgabe(aktuellerKnoten.LängeGeben()) 
Ausgabe(" Kanten") 


d Beispielsweise kann der rechtsstehende Graph verwendet werden. 
Die Suche könnte dann als Startknoten A und als Zielknoten D 
verwenden. 


Die Bedingung der ersten Wiederholung muss ergänzt werden: 


(aktuellerknoten != zielKnoten) ÜRENEEENEIEERHERENETEEN 


Die Ausgabe darf nur gemacht werden, wenn der aktuelle Knoten nicht leer ist, sonst muss 
eine Fehlermeldung ausgegeben werden. 
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Aufgaben in Kapitel 2 


T1 Richtig oder falsch? 


a richtig 

b Falsch: Mit vier Bit lassen sich 2-2: 2- 2=16 verschiedene Werte darstellen. 

c richtig 

d Falsch: Allerdings muss zunächst die Schlüssellänge bestimmt werden, ehe sich mehrere 
voneinander unabhängige Häufigkeitsanalysen einsetzen lassen. 

e Falsch: Der Schlüsselaustausch kann auch mit asymmetrischen Verschlüsselungsverfahren 
erfolgen. 

f Falsch: Die Quersumme einer gegebenen Zahl lässt sich leicht bilden, allerdings ist es 
schlichtweg unmöglich, aus einer gegebenen Quersumme die ursprüngliche Zahl zu rekons- 
truieren, auch nicht unter großem Aufwand. Die Quersumme 4 könnte beispielsweise sowohl 
für die Zahl 13 als auch für die Zahl 22 stehen. 

g Falsch: Wenn man eine Nachricht verschicken möchte, muss man diese mit dem öffentlichen 
Schlüssel des Empfängers verschlüsseln. 

h Falsch: Mittels einer digitalen Signatur kann die Integrität einer Nachricht gesichert werden. 


Cäsar und Vigen&re anwenden 
a PUALYULA 
b AOAYOGEYANEJACIAFZRZAEIXECIA 


Mögliche Schlüssel 


Anzahl möglicher Schlüssel Dauer* | Anzahl möglicher Schlüs- 
beim Vigenere-Verfahren bei sel beim Vigenere-Ver- 
26 Zeichen fahren bei 80 Zeichen 


26°=308 915 776 7 min. 80° 4,3d 
26°=208 827 064 576 3,4d 80° 76a 


* Dauer eines Brute-Force-Angriffs für das Durchprobieren aller Möglichkeiten, wenn sich 


700 000 Schlüssel pro Sekunde ausprobieren lassen 
Symmetrische und asymmetrische Verschlüsselung 


Symmetrische 
Verschlüsselung 


n(n-1) bein 
Teilnehmenden 


Asymmetrische 
Verschlüsselung 


n bei n Teilnehmenden 


Anzahl der notwendigen Schlüs- 
sel bei Nachrichtenaustausch 
unter mehreren Personen 


Notwendige Vorbereitung, um Persönliches Treffen Erzeugung eines persönli- 

Kommunikation durchführen zu | oder Schlüsseltausch chen Schlüsselpaars und Ver- 

können auf andere Weise öffentlichen des öffentlichen 
Schlüssels 


Berechnungsaufwand abhängig von Verfah- erhöht gegenüber symmetri- 
ren: im Allgemeinen scher Verschlüsselung, aber 
deutlich geringer als bei | abhängig von der 
asymmetrischen Schlüssellänge 
Verfahren 
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T5 Digitale Signaturen 

Alice: 
« Nachricht verfassen, 
« kryptografischen Hashwert der Nachricht berechnen, 
« Hashwert mit privatem Schlüssel von Alice verschlüsseln und 
« Nachricht und verschlüsselten Hashwert (Signatur) an Bob senden 

Bob: 
« empfangene Signatur mit öffentlichem Schlüssel von Alice entschlüsseln, 
+ kryptografischen Hashwert der empfangenen Nachricht berechnen und 
« berechneten Hashwert mit dem entschlüsselten Hashwert vergleichen. 

> Bei Übereinstimmung ist die Nachricht unverfälscht. 


Aufgaben in Kapitel 3 


T1 Richtig oder falsch? 

a Falsch: Die Kommunikation im Internet erfolgt oft nach dem Client/Server-Prinzip. 

b Falsch: Ein Switch kann zwar theoretisch mehrere Netze miteinander verbinden. Um eine 
sinnvolle Kommunikation zwischen den Netzen zu ermöglichen, sollte jedoch ein Router die 
Netze verbinden. Ein Switch kann innerhalb eines Netzes eingesetzt werden, um mehrere 
Geräte miteinander zu verbinden. 

Falsch: DNS steht für Domain Name System, welches Domains IP-Adressen zuordnet. 

d Falsch: Das Schichtenmodell teilt die Kommunikation im Internet in mehrere Schichten wie 
Anwendungs-, Transport-, Internet- und Netzzugangsschicht auf. 

e richtig 

f Falsch: Cookies dienen dazu, Nutzer über einzelne Anfragen hinweg zu identifizieren 


n 


T2 Ich check’s, dank deiner Hilfe! 


Die Kommunikation zwischen Maschinen erfolgt oft nach dem Client/Server-Prinzip. Dabei in- 
itiiert der Client die Kommunikation, während der Server als Dienstanbieter zunächst passiv auf 
eingehende Anfragen von Clients wartet. Ein Client kann beispielsweise bei einem Webserver 
eine Webseite anfragen. Dieser antwortet mit der passenden Seite. 


Mehrere Netze können mit Routern miteinander verbunden werden. Die Router sorgen dafür, 
dass die Datenpakete über die Netze hinweg schrittweise ans Ziel gelangen. Anhand von Rou- 
ting-Tabellen treffen sie Entscheidungen, über welchen Weg die Daten weitergeleitet werden. 


In einem lokalen Netz können mehrere Geräte über einen Switch verbunden werden. 


Die Kommunikation in Netzen verläuft im Schichtenmodell. Ein wichtiger Vorteil bei diesem 
Schichtenmodell ist die einfache Austauschbarkeit der konkreten Umsetzung einzelner Schich- 
ten. Ein weiterer Vorteil ist die Wiederverwendbarkeit bereits existierender Schichten für andere 
Zwecke. Die Kommunikation zwischen Rechnern kann durch das TCP/IP-Modell als Stapel aus 
insgesamt vier Schichten dargestellt werden: Anwendungs-, Transport-, Internet- und Netzzu- 
gangsschicht. 


Auf der Transportschicht verwenden Server Ports, um bestimmte Dienste anzubieten. Die 

Ports sind dabei durchnummeriert. Für häufig verwendete Dienste sind einheitliche Portnum- 
mern festgelegt (z. B. 80 für HTTP). Auch von Clients versendete Daten haben eine (oft zufäl- 

lig gewählte) Portnummer als Teil der Absenderadresse. Auf diese Weise können Ports dazu 
verwendet werden, mehrere Kommunikationsstränge zwischen gleichen Partnern auseinander- 
zuhalten. Ein Client-Rechner kann beispielsweise mit einer Webserver- und einer Mailserver-An- 
wendung auf dem gleichen Server-Rechner kommunizieren, ohne, dass dabei z. B. versehentlich 
Webseitenanfragen den Mailserver erreichen. 


T3 
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IP-Adressen werden verwendet, um Geräte auf der Internetschicht eindeutig zu identifizieren. 
Sie kommen in den Versionen IPv4 und IPv6 zum Einsatz. In lokalen Netzen werden bisher IPv4 
Adressen häufiger genutzt. Diese sind 32 Bit lang und werden zur besseren Lesbarkeit in vier 
Dezimalblöcken geschrieben (z. B. 192.168.1.2). Der sogenannte Netzanteil einer IP-Adresse 
gibt an, in welchem Netz sich ein Gerät befindet. Der sogenannte Hostanteil der Adresse ist in 
diesem Netz einmalig für ein Gerät vergeben. 


Auf der Netzzugangsschicht werden Geräte mithilfe der MAC-Adresse identifiziert. Sie ist 48 Bit 
lang und wird üblicherweise hexadezimal geschrieben (z. B. 12:34:DE:AD:BE:EF). 


Damit Maschinen erfolgreich Informationen austauschen können, müssen die Regeln für die 
Kommunikation in Protokollen eindeutig festgelegt werden. Typische Bestandteile eines Pro- 
tokolls sind das Ablaufschema der Kommunikation, die Codierung der zu übertragenden Daten 
und die Reaktion auf Fehler bei der Übertragung. 


Ein Cookie ist eine kleine Textdatei, die vom Server generiert, an den Client übermittelt und dort 
gespeichert wird. Bei späteren Anfragen wird der Client dann aufgefordert, den Inhalt dieser 
Textdatei als Teil der Anfrage mitzusenden. So kann der Server den Client erneut identifizieren. 
Cookies sorgen dafür, dass Zugangsdaten oder Einstellungen nicht bei jeder Anfrage erneut 
eingegeben werden müssen. Sie werden aber auch eingesetzt, um die Aktivität von Nutzern im 
Internet zu verfolgen (Tracking-Cookies). 


Kommunikation im Schichtenmodell 

a Anwendunggs-, Transport-, Internet-, Netzzugangsschicht 

b Die Endnutzer interagieren mit der Anwendungsschicht. Diese entspricht in der Regel dem 
jeweils genutzten Dienst (z. B. WWW, E-Mail, ...). Die Transportschicht stellt der eigentlichen 
Anwendung einen Ende-zu-Ende-Kommunikationskanal bereit, sodass die Client- und die 
Serveranwendung direkt Daten austauschen können. Die zentrale Aufgabe der Internet- 
schicht ist die Wegewahl (engl. routing). Insbesondere in großen Netzen wie dem Internet 
erreichen die Datensegmente der Transportschicht ihr Ziel in der Regel nicht direkt, sondern 
werden von Vermittlungsrechnern (Routern) bis ins Zielnetz weitergeleitet. Die Netzzu- 
gangsschicht sorgt für einen möglichst störungsfreien Kommunikationspfad zwischen den 
verschiedenen Stationen. 

c Jede Schicht verwendet unterschiedliche Protokolle. Auf der Senderseite durchlaufen die zu 
versendenden Daten alle Schichten. Alle verwendeten Protokolle ergeben den Protokollsta- 
pel. Ein Beispiel für einen solchen Stapel wäre HTTP auf der Anwendungsschicht, TCP auf der 
Transportschicht, IP auf der Internetschicht und 1000Base-T auf der Netzzugangsschicht. 

d Auf der Anwendungsschicht werden beispielsweise URLs verwendet, um einen Webserver 
zu kontaktieren. Auf der Transportschicht verwenden Server Ports, um bestimmte Dienste 
anzubieten. Die Internetschicht nutzt IP-Adressen zur eindeutigen Identifikation von Geräten. 
Auf der Netzzugangsschicht werden in der Regel sogenannte MAC-Adressen verwendet. 
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T4 Protokolle 

a Das HTTP-Protokoll legt auf der Anwendungsschicht die Regeln zum Abrufen einer Websei- 
te fest. Die Variante HTTPS ermöglicht eine verschlüsselte Kommunikation. E-Mails können 
beispielsweise mit dem SMTP- oder POP-Protokoll versendet werden. 

b Sind Protokolle in frei zugänglichen Dokumenten standardisiert und beschrieben, können 
alle diese Spezifikationen einsehen. Bei der Entwicklung von Software (z. B. einem E-Mail- 
Client) kann das Protokoll passend umgesetzt werden. Sollten sich Änderungen im Protokoll 
ergeben, können alle Produkte, welche das Protokoll verwenden, angepasst werden. Die 
Kommunikation in Netzen kann unabhängig von Betriebssystemen, Sprachen und Hardware 
umgesetzt werden. 

< individuell 


T5 Firewalls 

a Eine Firewall kann am Verbindungspunkt eines lokalen Netzes mit dem Internet oder auf 
individuellen Geräten verwendet werden, um die Angriffsmöglichkeiten aus dem Internet 
zu reduzieren. Es handelt sich bei einer Firewall um eine spezielle Software, welche den 
Datenverkehr vom und ins Internet überwacht und nach zuvor festgelegten Regeln filtert. 
Der Datenverkehr kann so auf bestimmte Protokolle oder festgelegte Adressen beschränkt 
werden. 

b Das Öffnen eines Ports bedeutet, eine Regel zur Firewall hinzuzufügen, welche die Kommuni- 
kation auf dem geöffneten Port erlaubt. 

< individuell 


Aufgaben in Kapitel 4 


T1 Richtig oder falsch? 

a Falsch: Verbreitete Anwendungen wie Bilderkennungssysteme, Sprachassistenten oder 
Textgeneratoren sind Vertreter schwacher Kl-Systeme. Starke Kl wurden in den 2010er Jahren 
jedenfalls nicht entwickelt. 

b Falsch: Bei unüberwachtem Lernen müssen die Daten über kein Label verfügen. 

c Falsch: Der k-Nächste-Nachbarn-Algorithmus wird (in diesem Buch) als überwachtes Lernver- 
fahren genutzt. 

d Falsch: Zur linearen Separation genügt ein einzelnes künstliches Neuron 

e Falsch: Die Neuronen der Eingabeschicht leiten die Werte unverändert an die Neuronen der 
nachfolgenden Schicht weiter. 

f Falsch: Nachvollziehbarkeit eines KI-Systems bedeutet nicht, dass man in allen Details be- 
gründen können muss, wie das System entscheidet, es sollten aber wesentliche Argumente 
für eine Entscheidung benannt werden können. 


T2 Ich check’s, dank deiner Hilfe! 
Starke und schwache Kl: Schwache Kl beschreibt Systeme, die nur eine bestimmte Aufgabe 
lösen können. Eine starke Kl hingegen würde über eine dem Menschen ebenbürtige Intelligenz 
verfügen oder diese sogar noch übertreffen. 
Überwachtes Lernen hat als Ziel jedem Datum ein (bekanntes) Label zuzuordnen. Als Eingabe 
erhält die Kl Datensätze, denen bereits Label korrekt zugeordnet sind. 
Maschinelles Lernen ordnet man Kls mit datenbasierten Ansätzen zu. 
Bei wissensbasierten Ansätzen werden (Experten-)Wissen, Regeln oder Strategien z.B. in Tabel- 
len und Entscheidungsbäumen gespeichert und angewendet bzw. durchsucht. 
Datenbasierte Ansätze nutzen hingegen Datenbestände, um selbst z. B. Regeln für Label, Grup- 
pierungen in den Daten oder vorteilhafte Aktionen zu finden. 
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Der k-Nächste-Nachbarn-Algorithmus ist ein überwachtes Lernverfahren, das für einen Daten- 
punkt unter Berücksichtigung seiner k nächsten Nachbarn ein Label vorhersagt. 
Entscheidungsbaum-Lernen ist das automatisierte Generieren eines Entscheidungsbaumes 
aus gelabelten Daten. 
Trainings-, Validierungs- und Testdaten: Für die Entwicklung eines Systems zum maschinellen 
Lernen werden Datensätze benötigt, bei denen die Lösung (z. B. die korrekte Klassifizierung) 
bereits vorab bekannt ist. Diese Datensätze werden dann zufällig in drei Gruppen aufgeteilt. Die 
Trainingsdaten werden verwendet, um das Kl-System zu trainieren, d.h., anhand dieser Daten 
lernt das System, wie es zukünftig arbeiten soll. Da oftmals nicht vorab ersichtlich ist, welche 
Hyperparameterwerte für ein gegebenes Anwendungsszenario die besten Ergebnisse pro- 
duzieren, werden hier oft unterschiedliche Wertekombinationen ausprobiert und anhand der 
Validierungsdaten überprüft, welche Hyperparameterwerte die besten Ergebnisse produzieren. 
Die Güte des Gesamtsystems kann abschließend dann mittels der Testdaten evaluiert werden. 
Hyperparameter: Viele Algorithmen zum maschinellen Lernen haben verschiedene „Stell- 
schrauben‘, mit denen festgelegt werden kann, wie der Algorithmus im Detail arbeitet. Im Ge- 
gensatz zu anderen Parametern, deren Werte das Kl-System beim Training eigenständig erlernt, 
müssen die Werte für diese sogenannten Hyperparameter manuell festgelegt werden. 
Künstliches Neuron: Zur Berechnung des Ausgabewertes werden die Eingabewerte mit den 
Gewichten multipliziert. Diese Produkte werden summiert und von der Summe wird der 
Schwellenwert abgezogen. 
Im Lernvorgang erfolgt die Anpassung der Gewichte nach der Formel: 
Waeu = Wu + aA * (Labelwert-berechnetes Ergebnis) - Eingabe 
Dabei ist a die Lernrate. Analog wird der Schwellenwert angepasst gemäß: 
Speu = Ssu- a * (Labelwert-berechnetes Ergebnis) 
Neuronale Netze können zur Identifikation komplexerer Strukturen genutzt werden und damit 
komplexe Probleme wie etwa Bilderkennung lösen. Ein neuronales Netz hat folgenden Aufbau: 
« Die Eingabeschicht besteht aus Neuronen, die jeweils für ein Eingabemerkmal stehen 
und die die Werte unverändert weiterleiten. 
« Inden Zwischenschichten passiert die eigentliche Datenverarbeitung. Mehr Neuro- 
nen und Zwischenschichten erlauben die Lösung komplexerer Probleme bei höherem 
Rechenaufwand. 
« Auf der Ausgabeschicht gibt es für jedes Ausgabemerkmal ein Neuron. 


T3 Künstliche Intelligenz 


a Ein Sprachlexikon wird i. A. umgesetzt durch eine Tabelle, in der Experten Wörter zweier Spra- 
chen einander zuordnen. Es wird also explizit Expertenwissen für eine Kl verfügbar gemacht, 
typisch für einen wissensbasierten Ansatz. 

b Wissensbasierte KI-Systeme: 

Eröffnungen bei einem Schachprogramm, Entscheidungsbäume bei Chatbots 
Datenbasierte Kl-Systeme: 

Mustererkennung zum Schutz vor Missbrauch von Kreditkarten (unüberwachtes Lernen); 
Erkennen von Verkehrsschildern (überwachtes Lernen), Optimierungsaufgaben z. B. bei der 
Ampelsteuerung (verstärkendes Lernen) 
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T4 Überwachtes Lernen (Alternative 1: k-Nächste-Nachbarn-Algorithmus) 


a i)k=1: violett ii) k=3: orange 
ii) k=4: Eine eindeutige Entscheidung ist nicht 
möglich > z. B. zufällige Wahl des Labels. 

b Um Over- und Underfitting zu vermeiden, soll- 
ten sehr kleine und sehr große Werte für k von 
vorneherein ausgeschlossen werden. Der in 
diesem Kontext wirklich beste Wert für k kann 
in der Regel aber nur gefunden werden, indem 
verschiedene Werte (innerhalb sinnvoller Gren- 
zen) ausprobiert und anhand der Validierungs- 


daten schließlich der am besten geeignete Wert 
ausgewählt wird. 


T4 Überwachtes Lernen (Alternative 2: Entscheidungsbaumlernen) 


a Informationsgewinn 
b Der linke Teilbaum wurde korrekt 
gebildet. Durch die Trennung nach 
dem Entscheidungsmerkmal Kern Kern? 


wird ein höherer Informationsge- (nen) 
winn erzielt, weil die Reinheit im lin- 

ken Blatt maximal ist (und die Rein- 

heit im rechten Blatt im Vergleich zu ® 
den Blättern des rechten Teilbaums \ 
sich nicht extrem unterscheidet). 

c Die Auswahl des ersten Entscheidungsmerkmals erfolgt durch den Algorithmus automatisch: 
Es wird stets zuerst das Merkmal mit dem höchsten Informationsgewinn ausgewählt. Die 
Merkmalsauswahl wird also anhand der Trainingsdaten erlernt und ist somit kein Hyperpara- 
meter. 


T5 Angst vor KI? 


i „Klklaut unsere Arbeitsplätze!” KI-Systeme können automatisierbare Tätigkeiten oft schneller 
und genauer ausführen als Menschen. Dadurch verändert sich unsere Berufswelt. Einerseits 
liegt der Fokus von Arbeitnehmerinnen und Arbeitnehmern etwa stärker auf sozialen oder 
kreativen Tätigkeiten, was zu einer Veränderung von existierenden Berufsbildern führt. 
Andererseits entstehen durch Kl aber auch zahlreiche neue Berufe, insbesondere im Bereich 
Informatik und Informationstechnologie. 

„Ki trifft Entscheidungen, die für uns nicht nachvollziehbar sind.“ Gerade bei datenbasierten An- 
sätzen und insbesondere neuronalen Netzen ist Transparenz häufig schwer herzustellen. Trifft 
eine künstliche Intelligenz personenbezogene Entscheidungen, etwa bei der Auswahl von 
Bewerbern, muss die Entscheidung aber erklärbar sein, d. h. die wesentlichen Gründe werden 
nachvollziehbar benannt. 

„Wozu noch Abi machen? Maschinen sind bald schlauer als wir und erledigen alle Arbeiten.” 
Schwache KlI-Systeme - und nur solche gibt es aktuell - können nur spezielle, klar umrissene 
Probleme lösen. Es lohnt sich allemal, noch Abitur zu machen, auch wenn man in Hinblick 
auf die Berufswahl im Blick haben sollte, welche Auswirkungen KI-Systeme auf bestimmte 
Berufe haben. 
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